Creating an online accessible database of high-frequency phrases including collocations and chunks with their CEFR levels
创建一个在线可访问的高频短语数据库,包括搭配和词组及其 CEFR 级别
基本信息
- 批准号:22H00677
- 负责人:
- 金额:$ 10.82万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2027-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究では、日本人英語学習者に特化したレベル別のコロケーション・チャンクリストを作成、公開することを目指す。コロケーション・チャンクの難易度は表面上の単語の難易度だけでは決まらない。特に英語と母語(日本語)のずれに起因する場合があり、日本の英語教育の向上に広く資するためには、母語の影響を考慮したリストの作成が不可欠である。また、対象となる単語を含む定形表現(チャンク)をリストアップすることは、英語学習者にとって有益であると考えられる。初年度である本年度は、(1)チームメンバー間の情報交換、(2)既存の辞書等からのコロケーション・チャンクの収集、(3) フレーズを考慮したコロケーション抽出プログラムの基礎の作成を目標に研究を進めた。(1)について、オンラインでの打ち合わせやSlack、メール等を使って情報交換し、それぞれが持つ資源および専門知、役割の確認を行った。(2)について、フレーズ辞書の見出し語の一覧の取得と、English Vocabulary Profileに含まれるフレーズをリストアップし、分析のための基礎データを構築した。(3)について、PPDB(The Paraphrase Database)から抽出したフレーズに対して、チャンクであるかどうかのアノテーションを実施し、それを学習データとしてBERTによって分類器を作成した。これによりチャンク抽出の土台が完成したが、ChatGPTに代表される生成系AIの出現により、新たな研究手法が可能となった(大規模言語モデルからのチャンクの抽出)。しかしながら、その有効性関しては未知数のところが多く、検証は今後の課題である。
在这项研究中,我们的目标是针对日本英语学习者按级别创建并发布搭配块列表。搭配词块的难度不仅仅取决于表面上单词的难度。特别是,这可能是由于英语和母语(日语)之间的差距造成的,为了广泛地促进日本英语教育的改善,有必要创建一个考虑到母语(日语)影响的列表。母语。此外,人们认为,对于英语学习者来说,列出包含目标单词的固定表达(词块)是有用的。今年是第一年,该研究的目标是(1)在团队成员之间交换信息,(2)从现有词典中收集搭配块,以及(3)创建考虑高级短语的搭配提取程序的基础。关于(1),我们通过在线会议、Slack、电子邮件等方式交换信息,确认各方的资源、专业知识和角色。关于(2),我们从短语词典和英语词汇表中列出的短语中获取了中心词列表,以构建用于分析的基础数据。关于(3),我们注释了从 PPDB(The Paraphrase Database)中提取的短语以确定它们是否是块,并将它们用作训练数据以使用 BERT 创建分类器。这完成了块提取的基础,但随着 ChatGPT 等生成式人工智能的出现,一种新的研究方法成为可能(从大规模语言模型中提取块)。然而,其有效性存在许多未知数,验证是一个未来的问题。
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Research on the Relationship between Difficulty Levels of Collocations and Their Constituent Words
搭配难度与其构成词的关系研究
- DOI:10.24546/0100479384
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Nishikawa;Megumi. & Nawata;Yoshinao.;西川惠・縄田義直;西川惠;石井康毅
- 通讯作者:石井康毅
Classification of Polysemous and Homograph Word Usages using Semi-Supervised Learning
使用半监督学习对多义词和同形词用法进行分类
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Han;S.;Iwana;B.K.;and Uchida;S.
- 通讯作者:S.
マスク言語モデルによる英文空所補充問題の解答能力に関する分析
使用掩码语言模型分析回答英语填空题的能力
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:田中康介;吉見菜那;梶原智之;内田諭;荒瀬由紀
- 通讯作者:荒瀬由紀
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
内田 諭其他文献
英語学習辞書における接続語の記述について
关于英语学习词典中连词的描述
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Uchida;Satoru;Junko;Haruyama;内田 諭 - 通讯作者:
内田 諭
大気圧プラズマ照射によるがん細胞への電気的作用の数値解析
大气压等离子体照射对癌细胞电效应的数值分析
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
山内 翔太;岩田 優太;八木 一平;内田 諭 - 通讯作者:
内田 諭
水環境中のポリスチレン微粒子の捕集に及ぼす誘電泳動用ピットサイズの影響
介电泳坑尺寸对水环境中聚苯乙烯细颗粒收集的影响
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
関 宏範;松本 悠佑;Puttaraksa Nitipon;八木 一平;内田 諭;石井 保行;西川 宏之 - 通讯作者:
西川 宏之
プラズマ―生体間の電荷・電界による膜機能制御の分子計算評価
等离子体与活体之间的电荷/电场控制膜功能的分子计算评估
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Ito Hiroki;AprilPyone MaungMaung;Shiota Sayaka;Kiya Hitoshi;内田 諭 - 通讯作者:
内田 諭
内田 諭的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('内田 諭', 18)}}的其他基金
コロケーション・チャンクを含む高頻度フレーズのCEFRレベル別リストの作成と公開
创建并发布 CEFR 级别的高频短语列表(包括搭配块)
- 批准号:
23K21949 - 财政年份:2024
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
プラズマ刺激細胞における膜層間電気システムの数理モデリング
等离子体刺激细胞膜间电系统的数学模型
- 批准号:
24K00873 - 财政年份:2024
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Numerical investigation of transport transition in biological membrane due to charge and electric field induced by discharge plasma
放电等离子体引起的电荷和电场引起的生物膜传输转变的数值研究
- 批准号:
21H01317 - 财政年份:2021
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
英語および日本語における談話標識の分析
英语和日语的话语标记分析
- 批准号:
07J09069 - 财政年份:2007
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for JSPS Fellows
ガス流および熱輸送を考慮したマイクロプラズマのモデリング
考虑气流和热传输的微等离子体建模
- 批准号:
18030016 - 财政年份:2006
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
レーザ誘起蛍光を援用した誘電泳動による細菌の高速計測に関する研究
激光诱导荧光介电泳高速测量细菌的研究
- 批准号:
17760340 - 财政年份:2005
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
マイクロプラズマ形成におけるガス種およびガス温度の影響評価
评估气体种类和气体温度对微等离子体形成的影响
- 批准号:
16040216 - 财政年份:2004
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
エキシマガスを用いた高効率プラズマディスプレイの基礎特性の研究
准分子气体高效等离子显示器基本特性研究
- 批准号:
13750253 - 财政年份:2001
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
プラズマディスプレイパネルにおけるガス組成および封入圧力の最適選定
等离子显示面板气体成分和密封压力的优化选择
- 批准号:
11750237 - 财政年份:1999
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
コロケーション・チャンクを含む高頻度フレーズのCEFRレベル別リストの作成と公開
创建并发布 CEFR 级别的高频短语列表(包括搭配块)
- 批准号:
23K21949 - 财政年份:2024
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
タスク開発とタスク教材のデータベース化
任务开发和任务材料数据库创建
- 批准号:
19K00782 - 财政年份:2019
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Creating French-English Bilingual Parallel Digital Edition of Ancrene Wisse for Lexical Comparison of French and English
创建 Ancrene Wisse 法英双语并行数字版,用于法语和英语的词汇比较
- 批准号:
18K00648 - 财政年份:2018
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Exploring Intentional Communication and Individual Phrasing Expressions in Piano Performance
探索钢琴演奏中的有意交流和个人乐句表达
- 批准号:
18K18491 - 财政年份:2018
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Compiling a Japanese-English Collocation Dictionary for English Production Using Large-scale Corpora
使用大规模语料库编写用于英语生产的日英搭配词典
- 批准号:
18H00693 - 财政年份:2018
- 资助金额:
$ 10.82万 - 项目类别:
Grant-in-Aid for Scientific Research (B)