T-LAB可用于Windows平台(Windows 7,8,10)。
对使用T-LAB感兴趣的MAC用户必须在其计算机上启用Microsoft Windows。
在预处理阶段,T-LAB进行语料库规范化,多词和停词检测,分为基本语境(即句子或段落),自动词形化或词干化(见下表), 关键词选择。
随后T-LAB允许综合使用三种工具进行文本分析:
|
N.B .:下面列出的所有视频都是指软件的过时版本。 他们的更新版本即将推出。
并存分析
文字关联
单词对之间的比较
共词分析和概念图
序列分析
词汇索引
专题分析
专题文件分类
基本语境的主题分析
基于字典的分类
新兴主题建模
主题词的凯语境
对比分析
特异性分析
对应分析
多重对应分析
聚类分析
应急表
下表总结了该软件的主要特点:
|
T-LAB Plus 2018 |
输入格式 |
所有语言的文本,包括使用表意文字的文本(即UTF-8格式的文件) |
语料库的最大尺寸 |
90 MB |
可以处理的文件格式 |
.txt,.doc,.docx,.pdf,.rtf,.html,.xls,.xlsx,.csv,.mdb,.accdb(N.B.仅限图像的PDF文件必须先使用OCR软件进行处理) |
支持词形或词干的语言 |
词形还原: 加泰罗尼亚语,克罗地亚语,英语,法语,德语,意大利语,波兰语,葡萄牙语,罗马尼亚语,俄语,塞尔维亚语,斯洛伐克语,西班牙语,瑞典语,乌克兰语; 词干: 阿拉伯文,孟加拉文,保加利亚文,捷克文,丹麦文,荷兰文,芬兰文,希腊文,印度文,匈牙利文,印度尼西亚文,马拉地文,挪威文,波斯文,土耳其文。 |
所有的T-LAB功能允许保存图表和表格。 文本和文档可以通过用户确定的变量进行分析和比较。目前,可用分类变量的数量固定为50,每个允许将语料库细分成多达150个可比较的子集。
用户界面,上下文帮助和手册有四种语言:英文,法文,西班牙文,意大利文。