畢業論文範文下載

附目錄

中文 摘 要 ....................................................... ⅲ

abstract .................................................... …….ⅳ

1 緒論 .............................................................. 1

1.1 引言 .......................................................... 1

1.2 本文研究的內容 ................................................ 1

1.3 研究的創新點 .................................................. 2

1.4 本文篇章結構 .................................................. 2

2 國內外研究現狀 ................................................... 4

2.1 trec 企業專家檢索子任務 ....................................... 4

2.2 現有專家檢索系統介紹 .......................................... 5

2.2.1 mitre expert finder ........................................ 6

2.2.2 people finder ............................................... 6

2.2.3 ibm small blue ............................................. 7

2.3 專家檢索其他相關研究 .......................................... 7

3 組織專家檢索系統的分析與設計 .................................. 9

3.1 系統總體思路 ................................................... 9

3.2 系統體系結構 .................................................. 11

3.2.1 spider 模組 ................................................ 11

3.2.2 indexer 模組 .............................................. 13

3.2.3 searcher 模組 ............................................. 14

3.2.4 assistant 模組 ............................................. 16

3.3 專家檢索系統的難點及對策 ..................................... 16

3.3.1 網頁數據噪音剔除 ........................................ 16

3.3.2 專家姓名重疊問題 ........................................ 17

3.3.3 專家網路分析 ........................................ 17

4 whu-es 的實現與評價 ........................................... 20

4.1 相關軟體介紹 ................................................. 20

4.1.1 lucene 全文檢索系統 ...................................... 20

4.1.2 netdraw 社會網路軟體 ..................................... 20

4.1.3 httpclient 開源項目 ........................................ 20

4.1.4 cmu 的facedetect 工具 .................................... 21

4.2 whu-es 的實現 ................................................ 21

4.2.1 初始輔助文檔庫的定義 .................................... 21

4.2.2 專家數據集的動態採集和更新 .............................. 21

4.2.3 數據集的規整及索引 ...................................... 22

4.2.4 專家自動生成的實現 .................................. 22