本网讯
6月10号下午两点半,思科bevictor伟德官网学术沙龙在南校区行政楼第一会议室举行。本次学术沙龙围绕应用于翻译质量评测等领域的中文信息处理的研究展开,思科bevictor伟德官网副经理李心广、英文学院博士李金辉以及各位年轻骨干老师和同学参加了本次沙龙。
李心广首先进行了发言,他说这次学术沙龙最大的特点就是年轻老师是其中的骨干,并且指出举办学术沙龙是为了让学校里拥有相同兴趣的老师能聚到一起,更深入得研究自己的领域以扩大其影响。
随后,李金辉博士也谈了自己在中文信息处理方面的见解,他提到主要有三个障碍:中文文字的输入、分时处理和句法分析。他也表示很期待在这次沙龙中能学到更多新的东西。
基于实例的文本翻译质量客观评价
柯晓华为大家介绍了英语翻译系统。她首先指明做这个系统的目的是提高翻译教学质量、激发员工学习主动性并帮助老师发现员工学习中的薄弱环节。柯晓华讲到,匹配的核心是语料库,该系统主要是考查翻译的“忠实度”和“流利度”,评分标准主要是句子的通顺度、特殊语法和关键词的处理。她也说这个系统是十分人性化的,把员工的翻译句与多个参考译文比较,取其中的最高分,以增加员工的自信心。柯晓华也讲到了接下来需要改进的地方,主要是语料库的补充,使系统能给员工和老师反馈更多的信息。
基于序列的文本相似性研究
郑琪为大家带来的是关于文本相似性比较的研究。他谈到文本模型主要有向量模型和后缀树模型,而他主要研究的是后缀树模型。文本比较时,系统首先会把it、that等没有实际意义的词语去掉,随后把出现的关键词依次串成一个分支,系统还会去掉只有一个结点的数据。郑琪也提到了所研究系统有待改进的地方:加入特征选择、改进后缀树的构建方法和降低空间复杂度。
互联网海量中文文本不良信息检测方法
李霞指出现在博客、论坛兴起,其中难免存在非法、暴力等不良信息,因此她研究的课题是中文文本不良信息的检测方法。她也分析了研究现状,主要是关键字的匹配、采用简单的原则过滤方法来识别以及现在的新趋势是基于文本的立场和观点。李霞谈到自己研究的内容是中文文本语义方法的研究和倾向性情感词典的构建、文本特征的提取和表示、文本整体篇章倾向观点的提取。最后李霞提到该研究成果可应用于网络中文不良信息检测、垃圾邮件和短信的过滤以及网络舆情分析等诸多方面。
柯晓华为这次学术沙龙做了总结,她为大家提出了那么多建设性的意见致谢,同时也表示希望能得到更多的批评和建议。
文/马顶铃 图/林奉慈 编辑/李丛