Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network
语料库文体学的机器学习方法:迈向国际协作网络的创建
基本信息
- 批准号:18H00675
- 负责人:
- 金额:$ 10.07万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2018
- 资助国家:日本
- 起止时间:2018-04-01 至 2022-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
まず,参照コーパスを構成するテクストのマークアップを改善するために,プログラミング言語Pythonで,テクストの構造を手がかりに,自動的に文書構造マークアップを実施するスクリプトの開発に注力した。このスクリプトの開発の結果,段落の前後を<p></p>でマークアップするだけでなく,テクスト中の引用の前後に<quote></quote>を埋め込む一方,スマートクウォートを全てダムクウォートに変換,nダッシュ,mダッシュともに<dash;/>タグに変換するほか,称号や数字の表記も統一することにより,底本テクストによるパンクチュエイションのばらつきを可能な限り最小化することを支援できるようになった。これを基に,テクストマークアップの質を高めるために推敲を進めた。並行して,トピックモデリングを文体論研究に応用するために,自然言語処理分野の先行研究を幅広く渉猟し,知識基盤の整備に努めた。この段階までの研究成果について以下のような形で発表・報告することにより,リビューを受けている。(1) 日本英文学会中国四国支部第74回大会シンポジウム「デジタル時代の英語英米文学研究と英語教育」パネル発表「確率論的トピックモデリングによるBritish classic fictionの「遠読」」(2) Western Australia Universityで開催されたBuilding Digital Humanitiesでのパネルセッション"Digital Humanities as/and computational Science"にてDHにおける機械学習について講演した。(3) フランスおよびドイツへ出張し,最新の研究情報を収集するとともに,連携拠点形成についての意見交換を行なった。
首先,为了改善制作参考外套的文本的标记 - ,我们专注于开发脚本,该脚本会使用编程语言Python中的文本结构自动实现文档结构标记。由于此脚本的开发,不仅在<p> </p>的段落之前和之后都标记,而且在文本中引号之前和之后都嵌入了<p> </p>的段落,而所有dam则嵌入KWAT都是大坝KWED。尽可能多。基于此,我们一直在详细阐述以提高文本标记的质量。同时,为了将主题建模应用于样式理论研究,协商了自然语言处理领域的广泛研究,知识基础也很紧张。通过以下形式发布和报告此阶段的研究结果,已经通过发布和报告研究结果进行了审查。 (1)日本英语学会,Chugoku Shikoku第74章研讨会“英语 - 美国文学研究和英语教育在数字时代”小组“英国经典小说”(2)西澳大利亚州,他在DH上在DH上进行了有关机器学习的讲座数字人文科学AS/和计算科学,在大学举行的数字人文学科的小组会议。 (3)我们前往法国和德国,收集了最新的研究信息,并就合作基础的形成交换了意见。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
「ズームイン・ズームアウト―デジタルヒューマニティーズとテクストの「読み」―」
《放大与缩小:数字人文与文本的“读”》
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司
- 通讯作者:田畑 智司
Tracing Thematic Transition in Dickens’s Literature and Journalism
追踪狄更斯文学与新闻学的主题转变
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Nagasaki;Kiyonori;田畑 智司;Saoko Funada;Tomoji Tabata;Tomoji Tabata
- 通讯作者:Tomoji Tabata
Stylometry and Classic British Fiction
文体测量学和英国经典小说
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司
- 通讯作者:田畑 智司
確率論的トピックモデリングによるBritish classic fictionの「遠読」(シンポジウム「デジタル時代の英語英米文学研究と英語教育」)
使用概率主题模型对英国经典小说进行“远读”(研讨会“数字时代的英语文学研究与英语教育”)
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司
- 通讯作者:田畑 智司
Digital Humanities as Non-Linear Reading: Style in classic British fiction
数字人文作为非线性阅读:英国经典小说的风格
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Nagasaki;Kiyonori;田畑 智司;Saoko Funada;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata
- 通讯作者:Tomoji Tabata
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
田畑 智司其他文献
知識基盤としてのデジタルライブラリーの将来
数字图书馆作为知识基础设施的未来
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
S. Nakao;K. Honda;A. Notsu;H. Ichihashi;呑海沙織・溝上智恵子;Y.Maeda;田畑 智司;土屋俊 - 通讯作者:
土屋俊
修辞項目のアノテーションを活用したテクスト分析
使用修辞项注释进行文本分析
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
斉藤まなぶ;大里絢子;田中勝則;増田貴人,高柳伸哉;安田小響;中村和彦;田畑 智司 - 通讯作者:
田畑 智司
Key words and textometry: Are key words really "key" words?
关键词和文本测量:关键词真的是“关键词”吗?
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
呉 沢臣;伊東 栄典;田畑 智司 - 通讯作者:
田畑 智司
Too many suspects, too much burstiness: A meta-analysis of key-word-detection statistics for stylometry
嫌疑人太多,突发性太多:文体测量关键词检测统计的元分析
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
呉 沢臣;伊東 栄典;呑海沙織;田畑 智司 - 通讯作者:
田畑 智司
ネットワーク図からみるディケンズ・レキシコン・デジタル―”word(s)”を含む見出し語を中心にして―
从网络图看狄更斯的数字词典 - 重点关注包括“单词”在内的词条 -
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Hitomi Onuma;Kuniya Nasukawa & Phillip Backley;砂川有里子;永田智洋・森大毅;高田智和;Kohji Shibano;Hisao Tokizaki & Kuniya Nasukawa;堀正広;小宮俊海;馬場俊臣;森大毅;石塚晴通;小宮俊海;田畑 智司;Jun Abe;伊東祐郎;守岡知彦;永岡篤・森大毅・有本泰子;砂川有里子;『真俗雑記問答鈔』訳注研究会(苫米地誠一・高橋秀城・小宮俊海);三宅真紀 - 通讯作者:
三宅真紀
田畑 智司的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('田畑 智司', 18)}}的其他基金
コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
- 批准号:
14710333 - 财政年份:2002
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
コンピュータコーパスを用いた18〜19世紀英語散文の文体研究
利用计算机语料库对18-19世纪英语散文进行文体研究
- 批准号:
12710254 - 财政年份:2000
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用
基于语料库语言学方法研究狄更斯风格的数据库构建及应用
- 批准号:
10710229 - 财政年份:1998
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
レ枢機卿による「マザリナード」研究-テクストの社会性を対象とする学域横断研究-
莱斯红衣主教的《Mazarinade》研究——针对文本社会性的跨学科研究——
- 批准号:
22KJ2078 - 财政年份:2023
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for JSPS Fellows
テクスト構造に基づくマンガの文字と画像データの統合的利用のための基盤の開発
基于文本结构的漫画文本与图像数据综合利用平台开发
- 批准号:
23K18642 - 财政年份:2023
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
From generality to specialization: a new phase of the knowledge environment for Buddhist studies in the digital medium
从普遍到专门:数字媒体佛学知识环境的新阶段
- 批准号:
23H00002 - 财政年份:2023
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
英米文学作品と歴史文体論:顔身体表現へのデジタルヒューマニティーズ的アプローチ
英美文学作品和历史文体学:面部和身体表达的数字人文方法
- 批准号:
23K00600 - 财政年份:2023
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ルソー政治思想に関する生成的手稿研究:『社会契約論』と『道徳書簡』を中心に
卢梭政治思想生成手稿研究:以“社会契约”与“道德书信”为中心
- 批准号:
22K00106 - 财政年份:2022
- 资助金额:
$ 10.07万 - 项目类别:
Grant-in-Aid for Scientific Research (C)