文字探勘,也被称为文本挖掘、文字采矿、智慧型文字分析、文字资料探勘或文字知识发现,一般而言,指的是从非结构化文字中,萃取出有用的重要资讯知识。文字探勘是一个刚起步的学科领域,它是透过资讯撷取、资料探勘、机械学习、统计学电脑语言学来达成。大部分的资讯(超过80%)都是以文字储存,因此,文字探勘被认为是有高度的潜在商业价值。