Trial Construction of an Advanced Computer-readable Lexical Database Capable of Automatic Acquisition of Lexical Information
自动获取词汇信息的先进计算机可读词汇数据库的试建
基本信息
- 批准号:07558274
- 负责人:
- 金额:$ 1.34万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (A)
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 1996
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
(1) Expansion of lexical data and classification of newspaper article data : Existing lexical data have been expanded using "Shin-Meikai Kokugo Jiten" (by Sanseido Publishing Co.) and EDR Electronic Dictionary (by Japan Electronic Dictionary Research Institute, Ltd.), and newspaper article data have been classified.(2) Determination of data structure for describing the semantic system : The data structure has been determined on the basis of the EDR Electronic Dictionary, and the data for the semantic system have been classified on a computer.(3) Design and implementation of the subsystem for automatic detection of unknown words : A program has been designed and implemented for the morphological and syntactic analysis of text, and for detecting unknown words.(4) Design and implementation of the subsystem for automatic inference on syntactic and semantic information of unknown words : The data structure has been determined and the program has been designed and implemented for the subsystem for automatic inference of systematic and semantic information of unknown words.(5) Implementation of the basic part of the advanced lexical database system and preliminary confirmation of its operation.(6) Determination of the detailed specifications for the lexical database system : A 40M byte main memory was adopted for the system.(7) Determination of the detailed specifications for the lexical data : The total numbern of lexical items are : 187,868 nouns, 645 pronouns, 10,620 verbs, 1,124 adjectives, 1,345 adverbs, and 144 others.(8) Construction of the advanced lexical database system : The system has been constructed using Arity/Prolog language, and currently occupies 142k bytes of memory.(9) Evaluation of the system : The performance of the system has been evaluated using the lexical data and the electronic texts from newspaper articles, and the results congirmed the basic validity of the current system.
(1) 词汇数据的扩展和报纸文章数据的分类:使用“新明海国语事典”(三精堂出版社)和 EDR 电子词典(日本电子词典研究所)对现有词汇数据进行了扩展(2)确定描述语义系统的数据结构:在EDR电子词典的基础上确定了数据结构,确定了语义系统的数据(3)生词自动检测子系统的设计与实现:设计并实现了文本的词法分析、句法分析以及生词检测的程序。(4)生词自动检测子系统的设计与实现。生词句法语义信息自动推理子系统的实现:生词系统语义信息自动推理子系统的数据结构已确定,程序已设计并实现。 (5) 生词系统语义信息自动推理子系统的实现进阶基础部分词汇数据库系统及其运行的初步确认。(6)词汇数据库系统详细规格的确定:系统采用40M字节主存储器。(7)词汇数据详细规格的确定:总计词汇数量为:187,868 个名词、645 个代词、10,620 个动词、1,124 个形容词、副词1,345个,其他144个。(8)高级词汇数据库系统构建:系统采用Arity/Prolog语言构建,目前占用内存142k字节。(9)系统评价:系统性能使用词汇数据和报纸文章的电子文本进行了评估,结果证实了当前系统的基本有效性。
项目成果
期刊论文数量(27)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
KAMEDA,Hiroyuki, KUBOMURA,Chiaki and SAKURAI Tomoko: "Experimental Evaluation of Unknown Word Acquisition System" Proceedings of the 1996 Engineering Sciences Society Conference of IEICE. 326-327 (1996)
KAMEDA、Hiroyuki、KUBOMURA、Chiaki 和 SAKURAI Tomoko:“未知词获取系统的实验评估”IEICE 1996 年工程科学学会会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
亀田弘之: "高次辞書データベースのための語彙知識自動獲得システム" 公開シンポジウム「人文科学とデータベース」. 75-82 (1995)
Hiroyuki Kameda:“高级词典数据库的自动词汇知识获取系统”公共研讨会“人文与数据库”75-82(1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
久保村千明: "未知語獲得アルゴリズムの評価" 電子情報通信学会技術研究報告. TL96-6. 21-30 (1996)
Chiaki Kubomura:“未知词获取算法的评估”IEICE 技术研究报告 TL96-6(1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
藤崎博也: "キ-概念の抽出と未知語の処理に基づく情報検索方式の高度化" 情報処理学会第54回(平成9年前期)全国大会講演論文集. 3. 23-24 (1997)
Hiroya Fujisaki:“基于关键概念提取和未知词处理的信息检索方法的改进”日本信息处理学会第54届全国会议论文集(1997年上半年)3. 23-24(1997年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
亀田弘之: "語彙・統語構造を対話的に獲得する知識獲得システム" 1996年電子情報通信学会総合大会講演論文集. 518-519 (1996)
Hiroyuki Kameda:“交互式获取词汇和句法结构的知识获取系统”1996 年 IEICE 大会记录 518-519 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
FUJISAKI Hiroya其他文献
FUJISAKI Hiroya的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('FUJISAKI Hiroya', 18)}}的其他基金
Automatic Estimation of Fundamental Frequency Contour Parameters and Automatic Acquisition of Generative rules
基频轮廓参数自动估计及生成规则自动获取
- 批准号:
11480090 - 财政年份:1999
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (B).
Construction of an Intelligent System for information Retrieval in an Environment of Information Network
信息网络环境下智能信息检索系统的构建
- 批准号:
09558041 - 财政年份:1998
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A System for Rule Synthesis of Prosodic Features of Speech of Multiple Language Based on a Generative Model of Fundamental Frequency Contours
基于基频轮廓生成模型的多语言语音韵律特征规则综合系统
- 批准号:
08458090 - 财政年份:1996
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
International Coordination of Speech Databases, Prosodic Labeling, and Speech Input/Output Systems Assessment
语音数据库、韵律标记和语音输入/输出系统评估的国际协调
- 批准号:
08044173 - 财政年份:1996
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for international Scientific Research
International Standardization of Spoken Language Detabases
口语数据库国际标准化
- 批准号:
05044112 - 财政年份:1993
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for international Scientific Research
Production of a Prototype Lexical Database Featuring High-speed, High-accuracy Access and Lexical Knowledge Acquisition
高速、高精度访问和词汇知识获取的原型词汇数据库的制作
- 批准号:
05558038 - 财政年份:1993
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Developmental Scientific Research (B)
A scheme for continuous speech recognition in a large context based on the human process of spoken language recognition
基于人类口语识别过程的大上下文连续语音识别方案
- 批准号:
03452164 - 财政年份:1991
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
Research on International Standardization of Spoken Language Database and Assessment Techniques for Speech Input/Output
口语数据库国际标准化及语音输入输出评估技术研究
- 批准号:
02044041 - 财政年份:1990
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for international Scientific Research
Co-operative Research on Modeling of Language Acquisition and Concept Formation Process in Engineering
工程中语言习得和概念形成过程建模的合作研究
- 批准号:
01300004 - 财政年份:1989
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Co-operative Research (A)
Research on Synthesis Method for Spoken Sentences from Knowledge Representation
知识表示的口语句子合成方法研究
- 批准号:
63420051 - 财政年份:1988
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for General Scientific Research (A)
相似海外基金
L1-acquisition of linguistic means for marking information structure: prosodic, syntactic and lexical aspects (E04 (C03))
L1-获取标记信息结构的语言手段:韵律、句法和词汇方面(E04(C03))
- 批准号:
289328530 - 财政年份:2015
- 资助金额:
$ 1.34万 - 项目类别:
Collaborative Research Centres
Automatic acquisition and use of lexical semantic information
词汇语义信息自动获取和使用
- 批准号:
227787-2007 - 财政年份:2011
- 资助金额:
$ 1.34万 - 项目类别:
Discovery Grants Program - Individual
Automatic acquisition and use of lexical semantic information
词汇语义信息自动获取和使用
- 批准号:
227787-2007 - 财政年份:2010
- 资助金额:
$ 1.34万 - 项目类别:
Discovery Grants Program - Individual
Automatic acquisition and use of lexical semantic information
词汇语义信息自动获取和使用
- 批准号:
227787-2007 - 财政年份:2009
- 资助金额:
$ 1.34万 - 项目类别:
Discovery Grants Program - Individual
Automatic acquisition and use of lexical semantic information
词汇语义信息自动获取和使用
- 批准号:
227787-2007 - 财政年份:2008
- 资助金额:
$ 1.34万 - 项目类别:
Discovery Grants Program - Individual