当前您所在的位置:首页>科学计算 数据统计分析>数据分析

T-LAB Tools for Text Analysis

T-LAB可用于Windows平台(Windows 7,8,10)。

对使用T-LAB感兴趣的MAC用户必须在其计算机上启用Microsoft Windows

在预处理阶段,T-LAB进行语料库规范化,多词和停词检测,分为基本语境(即句子或段落),自动词形化或词干化(见下表), 关键词选择。

随后T-LAB允许综合使用三种工具进行文本分析:

 

N.B .:下面列出的所有视频都是指软件的过时版本。 他们的更新版本即将推出。

并存分析

文字关联

单词对之间的比较

共词分析和概念图

序列分析

词汇索引

专题分析

专题文件分类

基本语境的主题分析

基于字典的分类

新兴主题建模

主题词的凯语境 

对比分析

特异性分析

对应分析

多重对应分析

聚类分析

应急表 

 

下表总结了该软件的主要特点:

 

T-LAB Plus 2018 

输入格式

所有语言的文本,包括使用表意文字的文本(即UTF-8格式的文件)

语料库的最大尺寸

90 MB

可以处理的文件格式

.txt,.doc,.docx,.pdf,.rtf,.html,.xls,.xlsx,.csv,.mdb,.accdb(N.B.仅限图像的PDF文件必须先使用OCR软件进行处理)

支持词形或词干的语言

词形还原:

加泰罗尼亚语,克罗地亚语,英语,法语,德语,意大利语,波兰语,葡萄牙语,罗马尼亚语,俄语,塞尔维亚语,斯洛伐克语,西班牙语,瑞典语,乌克兰语;

词干:

阿拉伯文,孟加拉文,保加利亚文,捷克文,丹麦文,荷兰文,芬兰文,希腊文,印度文,匈牙利文,印度尼西亚文,马拉地文,挪威文,波斯文,土耳其文。

所有的T-LAB功能允许保存图表和表格。 文本和文档可以通过用户确定的变量进行分析和比较。目前,可用分类变量的数量固定为50,每个允许将语料库细分成多达150个可比较的子集。

用户界面,上下文帮助和手册有四种语言:英文,法文,西班牙文,意大利文。

 

北京哲想软件有限公司