本网讯 4月至5月,公司外教Nicolas成功举办一系列学术讲座,其主题包含数字人文科学(Digital Humanities)、数据科学(Data Science)、对话代理(Conversational Agents)、数据聚类(Data Clustering)以及神经网络(neural networks)。
Nicolas在学术讲座
在数字人文科学讲座中,Nicolas先给出了数字人文科学的定义,即计算方法在人文探究中的应用以及对这一过程的批判性反思。他从时间和逻辑的维度逐步剖析了数字人文科学的发展及其起到的作用。接着,他列举了大量的例子加深我们对于数字人文科学的理解,带领着我们去辩证的思考问题,并就其当前遇到的问题以及研究使用工具做了简要介绍。除此之外,他还介绍了自己在相关方面的个人项目以及研究项目。
在数据科学讲座中, Nicolas先向我们介绍数据科学的定义,并从时间和逻辑的维度分析数据科学重要的发展及其对处理数据起到的重要作用。他提到,数据科学的第一次革命是从理论中演绎出来的,第二次革命是使用计算机进行建模,第三次革命则是归纳法。接着,他列举了大量的例子加深我们对于数据科学的理解。随后,他介绍了成为一个数据科学家的方法,以及其需要学习的课程和具备的能力。他还介绍了数据科学未来所面临的挑战,并通过对糖尿病案例的研究分析介绍了数据科员工命周期的主要阶段。
在对话代理讲座中,Nicolas给出对话代理的粗浅定义——一个总括性术语,指使用自然语言与用户交互的软件,无论是基于文本的还是基于语音的。随后,他援引一系列软件来介绍对话代理的发展历史以及应用。除此之外,他还讲解了一些常见的模型原理以及信息检索技术在对话代理中的应用。最后,他总结了对话代理的优缺点以及未来发展方向。
Nicolas与员工进行交流
在数据聚类讲座中,Nicolas首先通过列举排序算法的小游戏的例子让我们对数据集群的定义与应用有一个初步了解,他从时间和逻辑的维度逐步剖析了数据库集群的发展及其起到的独特作用。接着,他列举了大量的例子加深我们对于数据库集群的理解。除此之外,他还通过运行代码以及作图,详细讲解了K-means集群算法的实现过程和其背后的原理。接着,他指出数据集群目前所面临的挑战,如当数据量过多时,在辨别提提取方面有很大的困难。他还推荐了学习数据聚类知识相关的书籍。
在神经网络讲座中,Nicolas从连接主义方法、监督学习、深度学习三个方面深入介绍了关于神经网络的理论知识及具体的研究和应用。他指出神经网络是受生物学启发的计算机系统,并通过单层感知器和多层感知器IRIS数据集带我们进一步了解神经网络的原理,同时他还介绍一些具体的实验方法。此外,他还讲解了深度学习的长短期记忆网络、双向编码表示转换、卷积神经网络原理及其架构等相关知识。
至此,Nicolas系列讲座圆满结束。
初稿:韩琪琪 孙玲
审核:宋鹏飞 黄雯
终审:刘丽玉