研究方向:人工智能、自然语言处理、数据挖掘、非通用语种信息处理。
学习经历:博士毕业于中山大学,硕士毕业于韦德官方网站。
基本情况:湖南常宁人,博士,教授,硕士生导师,曾任广州市非通用语种智能处理重点实验室副主任;中国计算机学会(CCF)高级会员、中国人工智能学会(CAAI)会员、中国中文信息学会会员。
近五年,以第一作者身份或通讯作者身份在 《Knowledge Based Systems》《Information Processing & Management》《Expert Systems with Applications》《Journal of Intelligent & Fuzzy Systems》《Information Processing Letters》《中文信息学报》《小型微型计算机系统》《自动化学报》《情报学报》《情报杂志》等SCI\SSCI\CSSCI\CSCD学术期刊以及EMNLP、ICDAR、CCL等重要国际国内会议上发表论文30余篇;主持纵向课题7项,包括国家社会科学基金项目2项、教育部人文社会科学基金青年项目1项、广东省科技计划项目2项、广州市科技计划项目1项、广东省教育厅科研项目1项。此外,作为主要参与成员参与研究国家自然科学基金、广东省科技计划项目、广东省教育厅重大科研项目等多个项目;申请专利2项、授权1项,登记软件著作权10余项;指导员工获得中国老员工计算机设计大赛全国二等奖2项、三等奖1项,获得“挑战杯”广东老员工课外学术科技作品竞赛一等奖2项和三等奖2项,获得广东省攀登计划重点项目和一般项目立项4项,获得国家级/省级老员工创新训练计划项目3项。
联系邮箱:331423904@qq.com
个人主页:http://www.scholat.com/wanglianxi
一、代表性科研项目
[1]主持国家社会科学基金一般项目《突发公共卫生事件舆情中网民负面情绪检测及引导研究》,研究起止时间:2022/10-2025/12,在研
[2]主持国家社会科学青年基金项目《东盟涉华舆情的观点挖掘及其信息聚合研究》,编号:17CTQ045,研究起止时间:2017/10-2022/3,结项
[3]主持广东省软科学项目《“一带一路”背景下广东与东盟科技合作的宏观动因与微观机理研究》,编号:2019A101002108,研究起止时间:2019/10-2022/6,结项
[4]主持广州市科技计划项目《基于大规模文本的印尼语词汇资源自动构建技术研究》,编号:202002030227,研究起止时间:2020/4-2023/6,结项
[5]主持广东省普通高校重点领域(人工智能)项目《基于大规模资源的印地语词性标注语料库构建》,编号:2019KZDZX1016,研究起止时间:2020/1-2023/12,在研
[6]主持并完成广东省科技计划项目《广东省企业竞争情报信息提取及态势推理机制研究—以汽车行业为例》,编号:2015A030401093,研究起止时间:2015/9-2018/12,结项
[7]主持并完成教育部人文社会科学青年项目《微博热点事件发现及其内容自动摘要研究》,编号:14YJC870021,研究起止时间:2014/10-2017/10,结项
二、代表性论文
[1]Lianxi Wang, Yubing Ke. Feature Selection Considering Interaction, Redundancy and Complementarity for Outlier Detection in Categorical Data. Knowledge Based Systems, 2023:110678. https://doi.org/10.1016/j.knosys.2023.110678(中科院一区,SCI收录)
[2]Nankai Lin, Sihui Fu, Xiaotian Lin, Lianxi Wang*. Multi-label Emotion Classification Based on Adversarial Multi-task Learning. Information Processing & Management, 2022, 59(6):103097(中科院一区,SCI/SSCI收录)
[3]Lianxi Wang, Shengyi Jiang, Siyu Jiang. A feature selection method via analysis of relevance, redundancy, and interaction. Expert Systems with Applications, 2021,183:115365(中科院一区,SCI收录)
[4]Lianxi Wang, Xiaotian Lin, Nankai Lin. Research on pseudo-label technology for multi-label news classification//16th International Conference on Document Analysis and Recognition (ICDAR2021), LNCS 12822, 2021, pp. 683-698. (CCF C类会议,EI收录)
[5]Jiang Shengyi, Wang Lianxi*. Efficient Feature Selection Based on Correlation Measure between Continuous and Discrete Features. Information Processing Letters, 2016, 116(2): 203-215(SCI收录、EI收录)
[6]Jiang Shengyi, Wang Lianxi*. A clustering-based feature selection via feature separability. Journal of Intelligent & Fuzzy Systems, 2016, 31:927-937.(SCI收录、EI收录)
[7]Zhuowei Chen, Yujia Tian, Lianxi Wang* Shengyi Jiang. A Distantly-Supervised Relation Extraction Method Based on Selective Gate and Noise Correction. The Twenty-second China National Conference on Computational Linguistics, CCL 2023(EI收录)
[8]Lianxi Wang, Xiaotian Lin, Nankai Lin,Yingwen Fu, Kaiying Wu, Jiajun Wu. Humor Analysis in Spanish Tweets with Multiple Strategies. CEUR Workshop Proceedings, IberLEF 2021, September 2021, Málaga, Spain, 867-874.(EI收录)
[9]Yingwen Fu, Ziyu Yang, Nankai Lin, Lianxi Wang*, Feng Chen. Sentiment Analysis for Spanish Tweets based on Continual Pre-training and Data Augmentation. CEUR Workshop Proceedings, IberLEF 2021, September 2021, Málaga, Spain, 27-34.(EI收录)
[10]Lianxi Wang, Xiaotian Lin, Nankai Lin. Multilingual China-related News Identification Framework Based on Multiple Strategies. Workshop on Chinese Lexical Semantics. Springer, Cham, Nanjing, China, May 15–16, Springer, 2022:510-523.(EI收录)
[11]Lianxi Wang, Zhuolin Chen, Nankai Lin, Xixuan Huang.An Interdisciplinary Literature Classifier Based on Multi-task Multi-label Learning//2021 International Conference on Asian Language Processing (IALP). IEEE, 2021: 183-188. (EI收录)
[12]Xixuan Huang, Nankai Lin, Kexin Li, Lianxi Wang*,Suifu Gan. HinPLMs: Pre-trained Language Models for Hindi//2021 International Conference on Asian Language Processing (IALP). IEEE, 2021: 241-246. (EI收录)
[13]王连喜,林楠铠,邓致妍,蒋盛益. 印地语自然语言处理研究进展.中文信息学报, 2023, 37(5):53-69.
[14]王连喜,向杰益,黄锡轩,蒋盛益,赵瑞.东盟涉华舆情识别及特征分布研究—以主流英汉媒体为分析对象.情报杂志,2022,41(08):94-101.
[15]王连喜,甘穗福,林楠铠,蒋盛益.涉华信息资源归集与舆情分析框架构建.情报杂志, 2020, 39(6):135-142.
[16]王连喜.网络舆情领域相关概念分布及其关系辨析.现代情报, 2019, 39(6):132-141
[17]王连喜,蒋盛益,李霞,甘穗福.“一带一路”:研究热点与新兴主题发展分析.情报杂志, 2019, 38(2):71-77
三、部分专利及软著
[1]文本分类模型训练方法、文本分类方法、设备和介质. 申请号:202110332411.0, 专利号:ZL 2021 1 0332411.0,授权时间:2023.2.10
[2]多标签情绪分类模型的处理方法、系统和存储介质. 申请号:202110793238.4
[3]印地语检索系统. 登记号:2022SR1172706
[4]广东与东盟科技文献合作分析系统V1.0. 登记号:2021SR1284430
[5]面向东盟的重要新闻聚合系统. 登记号:2022SR1099680
四、部分指导学生成果
[1]“城市画像数据可视化平台”.第15届中国老员工计算机设计大赛二等奖,2022
[2]“中华汉语赋”.第15届中国老员工计算机设计大赛二等奖,2022
[3]“You are Right—汉语文本校对系统”.广东省老员工计算机设计大赛一等奖,2022
[4]“字里形间”.广东省老员工计算机设计大赛二等奖,2022
[5]“面向Dravidian语系的多语种文本分类框架”.广东省科技创新战略专项资金“攀登计划”重点项目(编号:pdjh2022a0171),资助金额:4.5万元,2022.
[6]“面向数据增强的样本选择和质量评估研究”.2022年省级老员工创新训练计划项目
[7]“基于对抗多任务学习的多标签情绪分类”.第十六届“挑战杯”广东老员工课外学术科技作品竞赛一等奖,2021.
[8]“基于多策略的多语言涉华新闻识别框架”.第十六届“挑战杯”广东老员工课外学术科技作品竞赛三等奖,2021
[9]“面向东盟的多语种新闻分类研究”.2020年国家级老员工创新训练计划项目,2020
[10]“鹰眼看中国”.第十五届“挑战杯”广东老员工课外学术科技作品竞赛一等奖,2019
[11]“新闻实体关系抽取与知识库构建”.2019年省级老员工创新创业训练计划项目,2019
[12]“印尼语-汉语平行语料自动获取与对齐方法研究”. 广东省科技创新战略专项资金“攀登计划”一般项目,2018
[13]“汽车企业产品评论挖掘系统”.第十届中国老员工计算机设计大赛三等奖, 2017
[14]“基于层叠条件随机场和情绪词典的社会情绪识别及分类研究”. 广东省科技创新战略专项资金“攀登计划”重点项目,2016
五、获奖情况
[1] 2022年度韦德官方网站优秀科研业绩三等奖
[2] 2021年度韦德官方网站优秀科研业绩三等奖
[3] 2017年度韦德官方网站优秀科研业绩二等奖
[3] 2015年度韦德官方网站优秀科研业绩三等奖