![]() |
利用NLP(Natural Language Processing)方法從PubMed文獻(xiàn)摘要數(shù)據(jù)庫中分析A基因調(diào)控網(wǎng)絡(luò),并對(duì)互作的基因進(jìn)行GO、pathway分析。
|
|||||||||||||||||
[發(fā)表評(píng)論] [本類其他服務(wù)] [本類其他服務(wù)商] |
服務(wù)商: 上海豐核信息科技有限公司 | 查看該公司所有服務(wù) >> |
一、項(xiàng)目目標(biāo):
利用NLP(Natural Language Processing)方法從PubMed文獻(xiàn)摘要數(shù)據(jù)庫中分析A基因調(diào)控網(wǎng)絡(luò),并對(duì)互作的基因進(jìn)行GO、pathway分析。
用途:
基因-基因互作網(wǎng)絡(luò)、基因-蛋白互作網(wǎng)絡(luò)、基因-microRNA互作網(wǎng)絡(luò)、蛋白-蛋白互作網(wǎng)絡(luò)、microRNA-microRNA互作網(wǎng)絡(luò)。
二、項(xiàng)目方案
2.1.基本流程
1) 利用關(guān)鍵詞進(jìn)行文檔搜索,并將文檔整理成XML格式。
2) 將摘要文本分離成單個(gè)句子。后續(xù)的分析是以句子為基本單位的。
3) 利用B軟件進(jìn)行人類基因的描述的定位,提取基因。
4) 基因符號(hào)以NCBI的entrez gene數(shù)據(jù)庫為準(zhǔn)。基因互作關(guān)系由B軟件繪制為網(wǎng)絡(luò)結(jié)構(gòu)。
5) 建立一個(gè)基因互作的verb詞典,分離句子中基因互作的verb。
6) 生成A基因同義詞字典,分離句子中A基因的描述。
7) 統(tǒng)計(jì)分析基因名、互作verb和A基因同時(shí)出現(xiàn)(co-occurrence)的句子,整理列表。基因互作關(guān)系由某軟件繪制為網(wǎng)絡(luò)結(jié)構(gòu)。
聯(lián)系我們:
上海總部:
網(wǎng)址:
電子郵箱:market@microsci.com
企業(yè)QQ:800068602
電話:4000-331-887
傳真:021-61268380轉(zhuǎn)8002
地址:上海市閔行區(qū)劍川路951號(hào)滄源科技園A樓102室
郵編:200241
淘寶地址:http://shop57095553.taobao.com
----聯(lián)系時(shí),請(qǐng)注明信息來自“中國生物器材網(wǎng)”----
用手機(jī)“掃一掃”,更多學(xué)術(shù)資訊齊分享!