blog上の意見分析のためのblogへの属性付与
为博客添加属性以进行博客观点分析
基本信息
- 批准号:18049025
- 负责人:
- 金额:$ 1.92万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
我々は,情報源としてblogに着目し,インターネット上の一般大衆の発信している意見を網羅的に収集,分析し,それをインターネット上のユーザに提供するシステムblogWatcherを研究開発している(http://blogwatcher.pi.titech.ac.jp).このようなblog上の意見収集・分析エンジンは,マーケティング等多くの分野で関心を持たれているが,母集団の不透明性,代表性の欠落等の理由により,現状では,分析結果の信頼性への疑問が払拭できていない.一方で,従来から行われている伝統的なアンケート等での意見分析では,原則バイアスのないようなサンプリングが普通であり,さらに,アンケート回答者の属性(たとえば,性別,年齢)等を別途情報として利用することにより,詳細な意見分析が可能となっている.そこで,本研究課題では,最終的な目標として,・収集したblogからのサンプリングを実現することにより,代表性のある母集団での意見分析を可能にする,・従来のアンケートと同程度の詳細さで,blog上での意見分析を実現することを目指し,blogの書き手がどういう人間であるかを推定する技術を開発する.18年度では,推定するべき個人属性として,性別を取り上げ,blogの書き手の性別を推定する技術を開発した.さらに,blogの書き手の個人属性を推定する際には,書き手の日々の行動が重要な手がかりとなり得ることに着目し,blogテキスト中の「行動」を表現する文を抽出し,その行動が1日のうちどの時間帯(朝,昼,夕,夜)に行なわれたものであるかを推定する技術を開発した.今後この行動マイニング技術をblogの書き手の個人属性推定に利用していく予定である.blogWatcherでは,開発したblogの書き手の性別推定の機能を実装することで,性別による分類ごとに分析結果を示すことを行なっている.性別の違いによって分析結果が異なっており,性別推定技術により,従来より詳細な分析が実現できることが確認できる.今後年齢層,性格等,さまざまな個人属性推定技術を開発することにより,より多面的な分析が可能になると考える.性別の推定では,日本語における男女の話し言葉の性質の違いを考慮した素性を利用することで,男性クラスで精度0.91,女性クラスで精度0.95と,高い精度を得た.blogテキスト中のイベントの生起時間帯判定では,イベントの生起時間帯の学習時に時間帯を連想させる語を同時に取得可能な学習アリゴリズムを用いることによって,86.4%の正解率を達成した.
我们专注于博客作为信息来源,并正在研究和开发一个博客观察员系统,该系统全面收集和分析了公众在Internet上发送的意见,并将其提供给Internet上的用户(http://blogwatcher.pi.pi.titech.ac.ac.ac.jp)。尽管这种博客意见收集和分析引擎在许多领域(例如营销)中引起了人们的关注,但由于人口不透明和缺乏代表性,目前尚未消除有关分析结果可靠性的问题。另一方面,传统调查和其他传统观点中的观点分析通常基于原则。公正的采样是普遍的,并且可以使用调查受访者(例如,性别,年龄)等的属性作为单独的信息,可以进行详细的意见分析。因此,在这个研究主题中,作为最终目标,通过从收集的博客中实现抽样,可以在代表人群中分析观点,并旨在对具有与传统调查相同的细节的博客意见实现观点,并开发技术来估计博客作者是什么样的人。在2018年,性别被视为应估算的个体属性,并写了博客。我们已经开发了一种估计手性别的技术。此外,当估计博客作者的个人属性时,我们专注于以下事实:作者的日常行动可能是重要的线索,并且我们开发了一种技术来提取在博客文本中表达“动作”的句子,并估算一天中的时间(早上,中午,晚上,晚上,晚上)在白天执行的动作。我们计划使用这种行为挖掘技术来估计博客作者的个人属性。 Blogwatcher实现了估计博客作者性别的性别功能,并通过性别显示了每个分类的分析结果。基于性别差异的分析结果是不同的,并且证实性别估计技术可以实现比以前更详细的分析。我们认为,通过开发各种个人属性估计技术,例如年龄段和个性,我们将能够实现更加多方面的分析。在性别估计中,我们使用的是根据日语中男性和女性之间口语性质的差异的特征,男性阶级的高精度为0.91,女性班级的差异为0.95。在博客文本中,我们通过使用学习算法的正确答案率达到了86.4%,该算法允许在学习事件发生时区时让人联想到与时区相关的时区。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
奥村 学其他文献
対話型意見収集システムの評価方法の検討
交互式意见收集系统评价方法的思考
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
大塚 裕子;乾 孝司;鈴木 泰山;丸元 聡子;伊藤 裕美;奥村 学 - 通讯作者:
奥村 学
Automatic Extraction of Travel Blog Entries
自动提取旅游博客条目
- DOI:
10.18996/kenkyu2016390305 - 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
藤井 一輝;難波 英嗣;竹澤 寿幸;石野 亜耶;奥村 学;倉田 洋平;石野 亜耶 - 通讯作者:
石野 亜耶
複数のソーシャルメディアアカウントの関連付け防止システムの構築
建立防止多个社交媒体帐户关联的系统
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
木原 裕二;笹野 遼平;高村 大也;奥村 学 - 通讯作者:
奥村 学
埒外の生態学にむけて―寄生と依存が生み出す社会
走向国界之外的生态:一个由寄生和依赖创造的社会
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
曹 国林;高村 大也;奥村 学;佐藤洋一郎;内藤直樹 - 通讯作者:
内藤直樹
奥村 学的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('奥村 学', 18)}}的其他基金
大規模事前学習モデルを活用した生成型複数テキスト要約に関する研究
使用大规模预训练模型的生成式多文本摘要研究
- 批准号:
24K02997 - 财政年份:2024
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Abstractive Neural Multi-document Summarization Considering Cross Document Structure
考虑跨文档结构的抽象神经多文档摘要
- 批准号:
21H03495 - 财政年份:2021
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
日タイブログを対象とした多観点言語横断ブログ検索
针对日语和泰语博客的多语言跨语言博客搜索
- 批准号:
08F08365 - 财政年份:2008
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for JSPS Fellows
対話に基づく意見収集・分析システムの構築に向けて
构建基于对话的意见收集与分析体系
- 批准号:
18650031 - 财政年份:2006
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Exploratory Research
情報に対する注目と価値判断のモデル化
建模对信息和价值判断的关注
- 批准号:
15650022 - 财政年份:2003
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Exploratory Research
仮想世界のキャラクタを用いた動作生成と身体的理解の研究
使用虚拟世界角色进行动作生成和物理理解的研究
- 批准号:
02F00607 - 财政年份:2002
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Web上のテキストデータを対象とした複数テキスト要約に関する研究
网络文本数据的多文本摘要研究
- 批准号:
14019036 - 财政年份:2002
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
自然言語処理技術を応用した外国語自習支援システムに関する研究
应用自然语言处理技术的外语自学支持系统研究
- 批准号:
12040217 - 财政年份:2000
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (A)
談話情報付きコーパスの構築とそれを用いた談話解析に関する研究
语篇信息语料库构建及语篇分析研究
- 批准号:
08837009 - 财政年份:1996
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
LGBTに関する宗教者の意見形成プロセスの調査と分析
宗教人士对LGBT观点形成过程的调查与分析
- 批准号:
24K15905 - 财政年份:2024
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
A novel, one stop, affordable, point of care and artificial intelligence supported system of screening, triage and treatment selection for cervical cancer and precancer in the LMICs
一种新型、一站式、经济实惠的护理点和人工智能支持系统,用于中低收入国家宫颈癌和癌前病变的筛查、分诊和治疗选择
- 批准号:
10560812 - 财政年份:2023
- 资助金额:
$ 1.92万 - 项目类别:
Human-centered CT-based CADx Tools for Traumatic Torso Hemorrhage
以人为中心、基于 CT 的 CADx 工具,用于治疗躯干外伤出血
- 批准号:
10566836 - 财政年份:2023
- 资助金额:
$ 1.92万 - 项目类别:
Abnormalities in androgens and ovarian markers in reproductive-age racially and ethnically diverse women in a prospective longitudinal cohort
前瞻性纵向队列中不同种族和民族的育龄女性雄激素和卵巢标志物的异常
- 批准号:
10930196 - 财政年份:2023
- 资助金额:
$ 1.92万 - 项目类别:
Cloud Enabled, Rigorous, Functional Assay Calibration (CERFAC)
支持云的严格功能测定校准 (CERFAC)
- 批准号:
10827690 - 财政年份:2023
- 资助金额:
$ 1.92万 - 项目类别: