刊名: 教育研究
主办: 中国教育科学研究院
周期: 月刊
出版地:北京市
语种: 中文;
开本: 大16开
ISSN: 1002-5731
CN: 11-1281/G4
邮发代号:2-277
历史沿革:
专题名称:教育理论与教育管理
期刊荣誉:社科双效期刊;国家新闻出版总署收录;中国期刊网核心源刊;CSSCI 中文社会科学引文索引来源期刊;北京大学《中文核心期刊要目总览》来源期刊;
创刊时间:1979
语料库语言学及语言科技发展国际会议综述
【作者】 王艳伟
【机构】 上海市浦东新区临港新城橄榄路1350号上海电机学院临港校区
【摘要】【关键词】
【正文】 摘 要:本次大会上来自世界各地的学者和研究团队报告了各自在语言学、语言学习和翻译研究中采用的各种新的技术和方法。研究主题集中在:语料库分析工具的开发及应用;语料库的设计与研制;基于语料库的多模态话语分析;语料库、对比研究和翻译;基于语料库的计算语言学;语料库、语言习得与教学及英语作为通用语的语料库研究等领域。会议组织了专家主旨报告(特邀报告)、研讨会、在线专题讨论会等。会议的一个重要特色是在闭幕前利用“简化广播”技术,四位大会发言人以“当全球英语遭遇全球华语”为题,进行了90分钟的在线专题讨论会。
关键词:全球英语;全球华语;主旨报告;研讨会;在线专题讨论会
Abstract:At the CoLTA 2015, new technological tools employed in corpora investigations into linguistics, language learning and translation studies have been introduced by scholars or research teams from all over the world. The themes of this conference focus on: development of corpus analysis tools and applications, corpus design and compilation, corpus-based multimodal discourse analysis, corpora, contrastive studies and translation, corpus-based computational linguistics, corpora, language acquisition and teaching as well as English as a Lingua Franca corpora studies. Keynote speeches, invited speeches, workshops and parallel sessions are arranged and one characteristic of the conference, featuring streamline broadcast, is the 90-minute online symposium titled “When world Englishes meet world Chineses”.
Key words:world Englishes; world Chineses; keynote speeches; workshops; online symposium
现代语料库语言学肇始以来,语料库就被广泛应用于第二语言教学和学习中。为了辅助二语习得,学界亦已开发了众多的语料库和语料库工具。语料库语言学及语言科技发展国际会议(The International Conference on Corpus Linguistics and Technology Advancement(CoLTA)2015)由香港教育学院语言学及现代语言系主办,于2015年12月16-18日顺利召开。本次大会旨在集聚来自世界各地的学者报告其语料库语言学相关的研究工作,尤其是在语言学、语言学习和翻译研究中采用的各种新的技术和方法。
本次大会的研究主题包括以下领域:1)语料库分析工具的开发及应用;2)语料库的设计与研制;3)基于语料库的多模态话语分析;4)语料库、对比研究和翻译;5)基于语料库的计算语言学;6)语料库、语言习得与教学;7)英语作为通用语的语料库研究。会议的组织形式有专家的主旨报告和特邀报告、研讨会、专题讨论会和分会场报告。
四位专家为本次大会做了主旨报告。来自澳大利亚格里菲斯大学的Andy Kirkpatrick教授是亚洲英语语料库(the Asian Corpus of English,简称ACE)项目的负责人,其主旨报告题为“亚洲英语语料库”。Andy Kirkpatrick首先通过近期分析ACE数据得到的研究发现,说明在语言学和文化层面英语为不同母语背景的亚洲英语使用者所塑造的进程;特别是考虑到英语在众多非“盎格鲁文化”语境(所谓的本族语者缺席的场景)中运用的事实,讨论了英语在东亚和东南亚作为通用语的发展为英语教学带来的启示;报告最后提出了在多语种场景中进行英语教学的一种重要的新型模式——通用语模式(the lingua franca approach),并对进行该教学模式提出了一些建议。如从本族语目标转向多语种目标、采用地方基准和措施,从语言水平测试转向功能水平测试,地方培训的多语种者被视为最佳的英语语言教师等。来自美国加州大学洛杉矶分校的陶红印教授的报告题为“多模态语料库研究”。多模态语料库因其包含丰富的信息被广泛认为代表了语料库开发的新阶段,然而如何为一些特定的目标创建和开发多模态语料库仍是有待解决的问题。陶教授以在加州大学洛杉矶分校等地开发的若干多模态语料库为例,讨论利用多模态数据进行话语分析和汉语语言教学的模式和方法,重在探讨多模态语料库引发的一些理论问题,以及利用多模态语料库为课堂教学和汉语作为二语/外语语境下的自主学习开发针对性更强的教学材料的具体方法。
会议开幕的第二天,来自香港理工大学的黄居仁教授做了“汉语语法变异”的主旨报告。随着中文作为二语的日益普及和中国人海外大移民潮的蔓延和发展,“全球华语”(World Chineses)这个术语,尽管不像“全球英语”(World Englishes)那样普遍,正日益广泛地为人们使用。然而,前人关于汉语变体的研究,倾向于聚焦词汇差异和囿于单言语变体驱动的视角。因此,利用汉语不同变体开发可比语料库(话题和覆盖面相似的两个及两个以上的语料库),可为全球华语开辟诸多新的研究路径。黄教授报告了基于全部赋码的汉语十亿词语料库(the Chinese Gigaword Corpus),就大陆和台湾普通话的语法变异研究的一些新发现。对以“加以/进行/从事/搞/做”为代表的汉语轻动词结构和动宾复合结构的分布差异进行了定性和定量描述,以此说明大陆和台湾普通话在论元选择限制和分布趋势上的明显差异。报告也表明,可将该领域研究所做的语言学概括以特征形式融入计算系统供机器学习(machine learning)和自动聚类(automatic clustering),以实现汉语不同变体的自动识别。
会议的第三天,来自英国伯明翰大学的Paul Thompson教授做了题为“语料库语言学与语言学习”的报告。报告伊始,Thompson教授通过逐渐增多的小鸟图片深入浅出地为与会者展示了语料库研究中“数大便是美”(Beauty in Numbers)的基本原理。随后回顾和讨论了“语料库增进的语言学习”(corpus-enhanced learning about language,简称为CELL)模式的潜力及其近期发展状况。该模式有望“实现基于证据的学习”(evidence-based learning)、“发现式学习”(discovery learning)、“发散式学习”(divergent learning)和“归纳式学习”(inductive learning)。值得注意的是,尽管关于语言学习大多数文献聚焦于二语或额外语言学习,Thompson教授的语言学习概念也包括一语的学习。他认为,通过语料库进行语言学习可以采取直接或间接利用语料库工具、研究发现及其研究路径的方式,但迄今为止大多数相关研究和应用都聚焦于间接利用。事实上,语料库研究围绕着观察语言使用的种种规律性及其变异进行,这种型式识别(pattern detection)是人类学习能力的一个基本组成部分。在意识到CELL的巨大潜力之后,我们需要鼓励直接利用语料库工具和研究路径,改变语言学习观念,更多地强调对语言使用事实的观察。
会议邀请来自香港城市大学的John Flowerdew和独立学者Lynne Flowerdew做了特邀报告。John Flowerdew报告的题目是“基于语料库的学术英语语言描写”。他认为,语言描写是第二语言教学大纲设计的基本要求。报告先介绍了在语言教学法领域的语料库研究中使用的一些基本概念和原则;接着对近期与学术英语写作教学相关的语料库研究进行了综述。报告聚焦于四种不同类型的语料库:高水平专业人士语料库、高水平学生语料库、二语学习者语料库和通用语语料库。报告最后对今后在语言教学研究中应用语料库方法提出了一些警示。Lynne Flowerdew的报告题为“学术写作的语料库资源和工具:研究基金申报书”。现今研究生的学术写作课程正日益针对“研究发表用途英语”(English for Research Publication Purposes,简称为ERPP),尤为关注研究论文的撰写。然而,因为研究论文得以发表通常首先要依赖研究或基金资助,研究基金申报书就成为ERPP课程中又一种值得关注的高风险的文类(除了研究论文外)。在报告中,Lynne Flowerdew描述了理工科研究生的基金申报书撰写模块的设计及其技术实现过程,该模块的一大特色是将John Swales式的自上而下的语步分析法与基于语料库的自下而上的词汇语法分析法结合在一起。报告先简要综述了基于语料库的基金申报书撰写相关研究,接着介绍了如何有效利用合适且免费获得的语料库和工具,帮助学生掌握并扩展其词汇语法知识,以精心撰写成功的研究基金申报书。
本次大会组织了三场研讨会,与10场分会场报告穿插进行。第一场研讨会在大会开幕第一天下午进行,题为“亚洲英语语料库(Asian Corpus of English,简称为ACE)探索”。 目前,英语通用语(English as a Lingua Franca简称为ELF)研究近年来得到了兴旺发展。然而,迄今可供研究使用的英语通用语语料库为数极少。ACE是继世界上第一个充分体现欧洲英语通用语口头交互特征的机读语料库——维也纳-牛津国际英语语料库(the Vienna-Oxford International Corpus of English,简称为VOICE)——建成后由亚洲研究团队成功创建的语料库,可视为VOICE的姊妹库。ACE项目成员为研究者、教师和学生展示了供研究和教学用的ACE语料库及各种自主开发的在线语料库工具的使用方法。项目负责人Andy Kirkpatrick介绍了ACE项目的总体情况,包括项目研究目标以及将ACE用于研究和教学的应用建议等。Wang Lixun介绍了ACE的在线检索平台,展示了ACE网站的各种特色,如根据不同范畴浏览ACE语料库数据、在线听ACE录音以及为研究和教学目的在线检索ACE语料库等。John Patkin聚焦启发法在ACE数据收集和转写中的作用,讨论了一些相关的方法和捷径。Lee Hsing-chin以ACE语料库中一位泰国和一位台湾的英语通用语使用者的对话为样本进行分析,识别出了一些可能造成交际中断的非标准性使用特征。通过这场研讨会,参会者对ACE语料库、ACE在线检索平台及其有效使用方法有了较深入的了解。
第二场研讨会在大会第二天下午进行,主题为“语料库与二语习得”,四位发言人分享了各自利用语料库工具辅助二语习得的宝贵经验。其中,来自英国伯明翰大学的Paul Thompson讨论了在语言学习和语言研究中(特别是学术语境中对语言使用不予评价时),使用在线检索工具Sketch Engine的几种方法。John Flowerdew介绍了其早期将语料库工具用于语言学习的几种途径。Ma Qing与参会者分享了一个学术英语学习者语料库以及她和同事开发的一个基于语料库的学术英语在线学习系统。Chen Hsueh Chu介绍了一个有音位标注的英语口语语料库以及和她的团队成员建立的一个基于语料库的语音在线学习系统。
数字人文科学是近几十年来新兴的一个研究领域,数字档案也随着技术进步不断得到充实,从而为来自不同学科背景的研究者开辟了偶然相遇、分享知识、信念和价值观的社会文化空间。在该空间中,人文科学和计算技术的交点强调对文化典藏的创建、保护和解释。本次大会的第三场研讨会的主题即为“中文数字人文科学”,四位发言人分别报告了各自在汉语数字人文科学领域的研究工作,包括汉语语言研究和汉语教学。自2012年以来,Andy Chin 就一直在开发“20世纪中期香港粤语语料库”,已利用ELAN对其中60部影片进行了转写和加工,其早期的粤语数字化项目亦已开始。Shin Kataoka报告了由香港教育学院语言学及现代语言系研究团队承担的粤语数字研究项目。据预期,该团队的研究将促进语言学与其它人文学科(如文学、历史、音乐和戏剧)之间的多种跨学科研究。黄居仁教授通过报告三项研究,讨论了利用现代本体论的链接数据模式缩小知识鸿沟的方法。该链接数据模式可用于解释缺乏完整明确的知识表征和特定历史时代概念系统的文本。这三项研究为: (1)基于唐诗300首典藏的小样本先导研究;(2)基于苏轼作品的单一作者本体论研究;(3)基于中国植物术语百科全书典籍《广群芳谱》的全方位分类法与本体论映射研究。长期以来,教师在语言教学中利用各种视觉辅助手段,包括图形、影视、动画片和幻灯片等。陶红印教授讨论了这些传统工具的新型使用方式,并介绍了一些可用于语言教学的新兴的可视化技术和工具,包括数据绘图和可视化、多模态展示和词云技术等。《大藏经》全卷5200万字,使用传统方法学者们很难独力对整个《大藏经》语料库开展(下转第45页)(上接第85页)研究。为此,John Lee介绍了《大藏经》树库——文本语料库句法分析数据库,描述了该树库的标注过程,并探讨了该树库为《大藏经》中句法和语义问题的量化分析开辟的可能性途径及方法。
作为语料库语言学及语言科技发展国际会议的一个重要特色,本次大会在闭幕前通过简化广播(streamline broadcast),由四位大会发言人领衔,进行了90分钟的在线专题讨论会,其主题为“当全球英语遭遇全球华语”。该在线专题讨论会提出了一个令人难以想象的问题:未来的人们,不管操何种第一语言,会被期待、甚至会被要求既学英语又学汉语吗?其中,Andy Kirkpatrick论及语言创新的混杂性(creative hybridity)、本族语者与非本族语者以及文化互渗(acculturation)和文化萎缩(deculturation),其发言的要点是:当越来越多的人成为操英汉双语者时,英汉两种语言可能怎样相互影响?他认为未来的汉英语言研究者探讨的最重要的问题也许是,在实现其实践应用(“用”)的工具性功能的同时,汉语和英语在多大程度上能为语言使用者提供建立其多语者身份必不可少的些许本质(“体”)?黄居仁教授从上古汉语(公元前16世纪至公元220年,夏朝至汉朝时期)、中古汉语(公元220至960年,南北朝至五代十国时期)、近代汉语(公元960至1919年,宋朝至五四运动时期)及现代汉语(公元1919年迄今)具有相同的正字法入手,提出弯而不折(bend but does not break)是国际语的一个重要特征。他聚焦讨论的问题是:汉语(正字法)的本体论结构是否唯一适合网络的语义转向?他认为汉语是一种具有高度适应性的可感受性驱动(qualia driven)的文字体系,字母文字为母语非汉语者学习汉语提供了方便,也预期了汉语发展成为混合语和国际语的强有力候选者的趋势。陶红印教授从美国视角讨论了汉语教学与汉语全球化问题。他认为,语言的全球化是一个长期的过程;汉语自身有利亦有弊;今后汉语能否成为国际语在很大程度上将取决于非语言因素。Paul Thompson作为讨论会参与者,与上述三位学者进行了互动。
近年来,随着越来越多的新兴技术工具得到开发并用于语料库语言学研究,许多国际、国内和港澳台地区的高校,都积极致力于该研究领域。本次语料库语言学及语言科技发展国际会议吸引了来自英语、美国、澳大利亚、法国、瑞典、波兰、日本、韩国、印度、马来西亚、新加坡、中国内地、香港、澳门和台湾地区的诸多研究人员和高校教师的积极参与,有望提升香港作为全世界语言学学者在技术驱动的语料库研究领域进行学术交流和合作的中心地位。
关键词:全球英语;全球华语;主旨报告;研讨会;在线专题讨论会
Abstract:At the CoLTA 2015, new technological tools employed in corpora investigations into linguistics, language learning and translation studies have been introduced by scholars or research teams from all over the world. The themes of this conference focus on: development of corpus analysis tools and applications, corpus design and compilation, corpus-based multimodal discourse analysis, corpora, contrastive studies and translation, corpus-based computational linguistics, corpora, language acquisition and teaching as well as English as a Lingua Franca corpora studies. Keynote speeches, invited speeches, workshops and parallel sessions are arranged and one characteristic of the conference, featuring streamline broadcast, is the 90-minute online symposium titled “When world Englishes meet world Chineses”.
Key words:world Englishes; world Chineses; keynote speeches; workshops; online symposium
现代语料库语言学肇始以来,语料库就被广泛应用于第二语言教学和学习中。为了辅助二语习得,学界亦已开发了众多的语料库和语料库工具。语料库语言学及语言科技发展国际会议(The International Conference on Corpus Linguistics and Technology Advancement(CoLTA)2015)由香港教育学院语言学及现代语言系主办,于2015年12月16-18日顺利召开。本次大会旨在集聚来自世界各地的学者报告其语料库语言学相关的研究工作,尤其是在语言学、语言学习和翻译研究中采用的各种新的技术和方法。
本次大会的研究主题包括以下领域:1)语料库分析工具的开发及应用;2)语料库的设计与研制;3)基于语料库的多模态话语分析;4)语料库、对比研究和翻译;5)基于语料库的计算语言学;6)语料库、语言习得与教学;7)英语作为通用语的语料库研究。会议的组织形式有专家的主旨报告和特邀报告、研讨会、专题讨论会和分会场报告。
四位专家为本次大会做了主旨报告。来自澳大利亚格里菲斯大学的Andy Kirkpatrick教授是亚洲英语语料库(the Asian Corpus of English,简称ACE)项目的负责人,其主旨报告题为“亚洲英语语料库”。Andy Kirkpatrick首先通过近期分析ACE数据得到的研究发现,说明在语言学和文化层面英语为不同母语背景的亚洲英语使用者所塑造的进程;特别是考虑到英语在众多非“盎格鲁文化”语境(所谓的本族语者缺席的场景)中运用的事实,讨论了英语在东亚和东南亚作为通用语的发展为英语教学带来的启示;报告最后提出了在多语种场景中进行英语教学的一种重要的新型模式——通用语模式(the lingua franca approach),并对进行该教学模式提出了一些建议。如从本族语目标转向多语种目标、采用地方基准和措施,从语言水平测试转向功能水平测试,地方培训的多语种者被视为最佳的英语语言教师等。来自美国加州大学洛杉矶分校的陶红印教授的报告题为“多模态语料库研究”。多模态语料库因其包含丰富的信息被广泛认为代表了语料库开发的新阶段,然而如何为一些特定的目标创建和开发多模态语料库仍是有待解决的问题。陶教授以在加州大学洛杉矶分校等地开发的若干多模态语料库为例,讨论利用多模态数据进行话语分析和汉语语言教学的模式和方法,重在探讨多模态语料库引发的一些理论问题,以及利用多模态语料库为课堂教学和汉语作为二语/外语语境下的自主学习开发针对性更强的教学材料的具体方法。
会议开幕的第二天,来自香港理工大学的黄居仁教授做了“汉语语法变异”的主旨报告。随着中文作为二语的日益普及和中国人海外大移民潮的蔓延和发展,“全球华语”(World Chineses)这个术语,尽管不像“全球英语”(World Englishes)那样普遍,正日益广泛地为人们使用。然而,前人关于汉语变体的研究,倾向于聚焦词汇差异和囿于单言语变体驱动的视角。因此,利用汉语不同变体开发可比语料库(话题和覆盖面相似的两个及两个以上的语料库),可为全球华语开辟诸多新的研究路径。黄教授报告了基于全部赋码的汉语十亿词语料库(the Chinese Gigaword Corpus),就大陆和台湾普通话的语法变异研究的一些新发现。对以“加以/进行/从事/搞/做”为代表的汉语轻动词结构和动宾复合结构的分布差异进行了定性和定量描述,以此说明大陆和台湾普通话在论元选择限制和分布趋势上的明显差异。报告也表明,可将该领域研究所做的语言学概括以特征形式融入计算系统供机器学习(machine learning)和自动聚类(automatic clustering),以实现汉语不同变体的自动识别。
会议的第三天,来自英国伯明翰大学的Paul Thompson教授做了题为“语料库语言学与语言学习”的报告。报告伊始,Thompson教授通过逐渐增多的小鸟图片深入浅出地为与会者展示了语料库研究中“数大便是美”(Beauty in Numbers)的基本原理。随后回顾和讨论了“语料库增进的语言学习”(corpus-enhanced learning about language,简称为CELL)模式的潜力及其近期发展状况。该模式有望“实现基于证据的学习”(evidence-based learning)、“发现式学习”(discovery learning)、“发散式学习”(divergent learning)和“归纳式学习”(inductive learning)。值得注意的是,尽管关于语言学习大多数文献聚焦于二语或额外语言学习,Thompson教授的语言学习概念也包括一语的学习。他认为,通过语料库进行语言学习可以采取直接或间接利用语料库工具、研究发现及其研究路径的方式,但迄今为止大多数相关研究和应用都聚焦于间接利用。事实上,语料库研究围绕着观察语言使用的种种规律性及其变异进行,这种型式识别(pattern detection)是人类学习能力的一个基本组成部分。在意识到CELL的巨大潜力之后,我们需要鼓励直接利用语料库工具和研究路径,改变语言学习观念,更多地强调对语言使用事实的观察。
会议邀请来自香港城市大学的John Flowerdew和独立学者Lynne Flowerdew做了特邀报告。John Flowerdew报告的题目是“基于语料库的学术英语语言描写”。他认为,语言描写是第二语言教学大纲设计的基本要求。报告先介绍了在语言教学法领域的语料库研究中使用的一些基本概念和原则;接着对近期与学术英语写作教学相关的语料库研究进行了综述。报告聚焦于四种不同类型的语料库:高水平专业人士语料库、高水平学生语料库、二语学习者语料库和通用语语料库。报告最后对今后在语言教学研究中应用语料库方法提出了一些警示。Lynne Flowerdew的报告题为“学术写作的语料库资源和工具:研究基金申报书”。现今研究生的学术写作课程正日益针对“研究发表用途英语”(English for Research Publication Purposes,简称为ERPP),尤为关注研究论文的撰写。然而,因为研究论文得以发表通常首先要依赖研究或基金资助,研究基金申报书就成为ERPP课程中又一种值得关注的高风险的文类(除了研究论文外)。在报告中,Lynne Flowerdew描述了理工科研究生的基金申报书撰写模块的设计及其技术实现过程,该模块的一大特色是将John Swales式的自上而下的语步分析法与基于语料库的自下而上的词汇语法分析法结合在一起。报告先简要综述了基于语料库的基金申报书撰写相关研究,接着介绍了如何有效利用合适且免费获得的语料库和工具,帮助学生掌握并扩展其词汇语法知识,以精心撰写成功的研究基金申报书。
本次大会组织了三场研讨会,与10场分会场报告穿插进行。第一场研讨会在大会开幕第一天下午进行,题为“亚洲英语语料库(Asian Corpus of English,简称为ACE)探索”。 目前,英语通用语(English as a Lingua Franca简称为ELF)研究近年来得到了兴旺发展。然而,迄今可供研究使用的英语通用语语料库为数极少。ACE是继世界上第一个充分体现欧洲英语通用语口头交互特征的机读语料库——维也纳-牛津国际英语语料库(the Vienna-Oxford International Corpus of English,简称为VOICE)——建成后由亚洲研究团队成功创建的语料库,可视为VOICE的姊妹库。ACE项目成员为研究者、教师和学生展示了供研究和教学用的ACE语料库及各种自主开发的在线语料库工具的使用方法。项目负责人Andy Kirkpatrick介绍了ACE项目的总体情况,包括项目研究目标以及将ACE用于研究和教学的应用建议等。Wang Lixun介绍了ACE的在线检索平台,展示了ACE网站的各种特色,如根据不同范畴浏览ACE语料库数据、在线听ACE录音以及为研究和教学目的在线检索ACE语料库等。John Patkin聚焦启发法在ACE数据收集和转写中的作用,讨论了一些相关的方法和捷径。Lee Hsing-chin以ACE语料库中一位泰国和一位台湾的英语通用语使用者的对话为样本进行分析,识别出了一些可能造成交际中断的非标准性使用特征。通过这场研讨会,参会者对ACE语料库、ACE在线检索平台及其有效使用方法有了较深入的了解。
第二场研讨会在大会第二天下午进行,主题为“语料库与二语习得”,四位发言人分享了各自利用语料库工具辅助二语习得的宝贵经验。其中,来自英国伯明翰大学的Paul Thompson讨论了在语言学习和语言研究中(特别是学术语境中对语言使用不予评价时),使用在线检索工具Sketch Engine的几种方法。John Flowerdew介绍了其早期将语料库工具用于语言学习的几种途径。Ma Qing与参会者分享了一个学术英语学习者语料库以及她和同事开发的一个基于语料库的学术英语在线学习系统。Chen Hsueh Chu介绍了一个有音位标注的英语口语语料库以及和她的团队成员建立的一个基于语料库的语音在线学习系统。
数字人文科学是近几十年来新兴的一个研究领域,数字档案也随着技术进步不断得到充实,从而为来自不同学科背景的研究者开辟了偶然相遇、分享知识、信念和价值观的社会文化空间。在该空间中,人文科学和计算技术的交点强调对文化典藏的创建、保护和解释。本次大会的第三场研讨会的主题即为“中文数字人文科学”,四位发言人分别报告了各自在汉语数字人文科学领域的研究工作,包括汉语语言研究和汉语教学。自2012年以来,Andy Chin 就一直在开发“20世纪中期香港粤语语料库”,已利用ELAN对其中60部影片进行了转写和加工,其早期的粤语数字化项目亦已开始。Shin Kataoka报告了由香港教育学院语言学及现代语言系研究团队承担的粤语数字研究项目。据预期,该团队的研究将促进语言学与其它人文学科(如文学、历史、音乐和戏剧)之间的多种跨学科研究。黄居仁教授通过报告三项研究,讨论了利用现代本体论的链接数据模式缩小知识鸿沟的方法。该链接数据模式可用于解释缺乏完整明确的知识表征和特定历史时代概念系统的文本。这三项研究为: (1)基于唐诗300首典藏的小样本先导研究;(2)基于苏轼作品的单一作者本体论研究;(3)基于中国植物术语百科全书典籍《广群芳谱》的全方位分类法与本体论映射研究。长期以来,教师在语言教学中利用各种视觉辅助手段,包括图形、影视、动画片和幻灯片等。陶红印教授讨论了这些传统工具的新型使用方式,并介绍了一些可用于语言教学的新兴的可视化技术和工具,包括数据绘图和可视化、多模态展示和词云技术等。《大藏经》全卷5200万字,使用传统方法学者们很难独力对整个《大藏经》语料库开展(下转第45页)(上接第85页)研究。为此,John Lee介绍了《大藏经》树库——文本语料库句法分析数据库,描述了该树库的标注过程,并探讨了该树库为《大藏经》中句法和语义问题的量化分析开辟的可能性途径及方法。
作为语料库语言学及语言科技发展国际会议的一个重要特色,本次大会在闭幕前通过简化广播(streamline broadcast),由四位大会发言人领衔,进行了90分钟的在线专题讨论会,其主题为“当全球英语遭遇全球华语”。该在线专题讨论会提出了一个令人难以想象的问题:未来的人们,不管操何种第一语言,会被期待、甚至会被要求既学英语又学汉语吗?其中,Andy Kirkpatrick论及语言创新的混杂性(creative hybridity)、本族语者与非本族语者以及文化互渗(acculturation)和文化萎缩(deculturation),其发言的要点是:当越来越多的人成为操英汉双语者时,英汉两种语言可能怎样相互影响?他认为未来的汉英语言研究者探讨的最重要的问题也许是,在实现其实践应用(“用”)的工具性功能的同时,汉语和英语在多大程度上能为语言使用者提供建立其多语者身份必不可少的些许本质(“体”)?黄居仁教授从上古汉语(公元前16世纪至公元220年,夏朝至汉朝时期)、中古汉语(公元220至960年,南北朝至五代十国时期)、近代汉语(公元960至1919年,宋朝至五四运动时期)及现代汉语(公元1919年迄今)具有相同的正字法入手,提出弯而不折(bend but does not break)是国际语的一个重要特征。他聚焦讨论的问题是:汉语(正字法)的本体论结构是否唯一适合网络的语义转向?他认为汉语是一种具有高度适应性的可感受性驱动(qualia driven)的文字体系,字母文字为母语非汉语者学习汉语提供了方便,也预期了汉语发展成为混合语和国际语的强有力候选者的趋势。陶红印教授从美国视角讨论了汉语教学与汉语全球化问题。他认为,语言的全球化是一个长期的过程;汉语自身有利亦有弊;今后汉语能否成为国际语在很大程度上将取决于非语言因素。Paul Thompson作为讨论会参与者,与上述三位学者进行了互动。
近年来,随着越来越多的新兴技术工具得到开发并用于语料库语言学研究,许多国际、国内和港澳台地区的高校,都积极致力于该研究领域。本次语料库语言学及语言科技发展国际会议吸引了来自英语、美国、澳大利亚、法国、瑞典、波兰、日本、韩国、印度、马来西亚、新加坡、中国内地、香港、澳门和台湾地区的诸多研究人员和高校教师的积极参与,有望提升香港作为全世界语言学学者在技术驱动的语料库研究领域进行学术交流和合作的中心地位。