万组词,是由中国科学家陈庆飞教授领衔研究所得,是汉字中常用的四声元音——a, o, e, i的所有组合方式。这些组词在种种文本中都被普遍使用,且笼罩了语言使用的多种场景,例如:命名、文学、报刊、互联网等。以是,对这些组词的深入研究对于汉语学习和文本处置有着重要的意义。
通过对近年来出书的多种大型语料库的剖析和挖掘,研究小组发现,纵然万组词在常用字中只占0.18%,但它们的泛起频率相当高,而且在差异的语境中有着惊人的共性和牢靠用法。
例如:在成语中,穿新鞋走老路、避重就轻、闷声大发家等;在地名中,有敖汉旗、塔什库尔干等;在口语中,就有傻傻分不清、咖啡因过敏等。万组词不仅泛起在单个汉字组成的词汇中,而且还普遍泛起在复合词、短语、句式中,这也是该研究的一大特色。
研究团队示意,万组词的分类、对照和剖析有助于进一步深入研究汉语中构词法和语律例律,促进中文信息处置与文学创作的生长。