研究發展-方向與目標


» 挑選比對
返回 » 建站服務 | e化專欄
Welcome 使用者 訪客
返回原資料 » 文件近似度量測理論 | 延伸關聯運用-近似度分析 |
09, Apr., 2020 (THU) 18:51

交叉比對 :cross-reference

    文件近似度量測理論延伸關聯運用-近似度分析
  1. 先設定排除的篩選規則,判斷初步取樣的字詞,如果符合排除規則即無效、即排除取樣,反之則保留成為有效搜尋關鍵字(Search Tags ) 。
  2. 當存取時,做必要的更新記錄(沒必要的時候不要做,避免執行效率降低),在取樣關鍵字(i Tags )資料庫中,依吻合文件量更新排序 。
  3. Tags 列 。
  4. 讀取 i Tags 後比對目標文件,可以產生一條 Tags 列 。
  5. Ref Tags
  6. 當很多不同的資訊被讀取後,分別將他們個別 Tags 列的重要訊息記錄在 Ref Tags 資料庫 。
  7. 比對 Ref Tags
  8. 用 i Tags 去比對 Ref Tags
  1. 把閱讀網站資訊的過程模擬成旅遊,標籤( Tags )成為使用者的休息站 。
  2. 使用 Tags 已研發的技術 。
  3. Tags Explorer 搜尋標籤訊息列:關鍵字、符合文件數 。
  4. Refferenced Tags ' List of the Headline and Content (ref_tag_hc) 表:文件序號(document_id), 標題關鍵字(idtimesrn_h), 本文關鍵字(idtimesrn_c) 。
  5. 相同度量化分析: 有相同的 Tags [關鍵字a(1/符合文件數)+關鍵字b(1/符合文件數)+...+關鍵字n(1/符合文件數)] ) 。
  6. 差異度量化分析: 不同的 Tags [關鍵字a(1/符合文件數)+關鍵字b(1/符合文件數)+...+關鍵字n(1/符合文件數)] ) 。
  7. 當顯示 Tags Explorer 時,產生 ref_tag_hc list,檢查該資料的 Tags List 是否存在 或 是否需要更新 。
  8. 滑鼠移到延伸閱讀標題時,顯示的註解:提示該文與本文相關聯的相同點( Tags )與其(數量) 。
  1. 文件 近似度量測理論 。
  2. 要研究資訊 文件 間的獨立性、從屬性、關聯性、相似度與差異度的量化分析 。
  3. 如果我們以一篇資訊 文件 為個體來研究,其具有標題與內容、作者、時間 。
  4. 標題,是 文件 的主題句,其文字在整篇資訊中,具有相對較高的關鍵字與索引參考 。
  5. 內容中的資料可區分成文字與多媒體,分出來的多媒體(一般多為圖片或影片),可依它所在 文件 中的區塊位置,可透過該區塊的文字來分析多媒體的特性 。
  6. 當初步取樣經搜尋後,找不到或者找到太多(多過總 文件 比例的1/2)或找到少於2個的情形下,都必需先排除,由於設置的是比例,所以它會隨資訊 文件 的多寡而自動調整 。
  7. 當存取時,做必要的更新記錄(沒必要的時候不要做,避免執行效率降低),在取樣關鍵字(iTags)資料庫中,依吻合 文件 量更新排序 。
  8. 讀取 文件 時,進行關鍵字比對,如同 DNA 的概念 。
  9. 讀取 iTags 後比對目標 文件 ,可以產生一條 Tags 列 。
  10. 定義輸出條件、數量限制、輸出區塊,以顯示延伸閱讀或關聯 文件 的標題 。
  1. Tags Explorer 搜尋標籤訊息列:關鍵字、符合 文件 數 。
  2. Refferenced Tags' List of the Headline and Content (ref_tag_hc) 表: 文件 序號(document_id), 標題關鍵字(idtimesrn_h), 本文關鍵字(idtimesrn_c) 。
  3. 文件 近似度量測理論: 。
  4. 相同度量化分析: 有相同的 Tags [關鍵字a(1/符合 文件 數)+關鍵字b(1/符合 文件 數)+...+關鍵字n(1/符合 文件 數)] ) 。
  5. 差異度量化分析: 不同的 Tags [關鍵字a(1/符合 文件 數)+關鍵字b(1/符合 文件 數)+...+關鍵字n(1/符合 文件 數)] ) 。
  6. 定義輸出條件、數量限制、輸出區塊,以顯示延伸閱讀或關聯 文件 的標題 。
    文件近似度量測理論延伸關聯運用-近似度分析
    文件近似度量測理論延伸關聯運用-近似度分析
    文件近似度量測理論延伸關聯運用-近似度分析
  1. 資訊 近似與差異的量化 。
  2. 資訊 近似與差異的量化 。
  3. 要研究 資訊 文件間的獨立性、從屬性、關聯性、相似度與差異度的量化分析 。
  4. 必須先瞭解 資訊 它所呈現出的樣貌、可能的格式,並設法拆解它 。
  5. 如果我們以一篇 資訊 文件為個體來研究,其具有標題與內容、作者、時間 。
  6. 標題,是文件的主題句,其文字在整篇 資訊 中,具有相對較高的關鍵字與索引參考 。
  7. 作者,是 資訊 發行者 。
  8. 可追溯 資訊 的發行軌跡,找出起始源頭,或散佈節點 。
  9. 當初步取樣經搜尋後,找不到或者找到太多(多過總文件比例的1/2)或找到少於2個的情形下,都必需先排除,由於設置的是比例,所以它會隨 資訊 文件的多寡而自動調整 。
  10. 當很多不同的 資訊 被讀取後,分別將他們個別 Tags 列的重要訊息記錄在 Ref Tags 資料庫 。
  11. 利用自動 資訊 探勘,進行自動關聯 。
  12. 自動 資訊 探勘 。
  13. 整合「取樣自動化」、「比對自動化」,安排適當的 資訊 動線,探勘到使用者所需的目標 資訊
  1. 是什麼原因促使站主想要建立 資訊 ? 。
  2. 資訊 為什麼要用網路來發佈或取得? 。
  3. 資訊 資訊 之間怎樣自動產生關係?用什麼方式讓他們自己自然地連在一起? 。
  4. 留住讀者,創造較高的點閱率,讓網站建立 資訊 者的辛苦有價值 。
  5. 把閱讀網站 資訊 的過程模擬成旅遊,標籤(Tags)成為使用者的休息站 。
  6. 運用 Fuzzy 理論的近似推理(Approximation reasoning),根據自動 資訊 探勘的結果,處理 資訊 內容的模糊集合、模糊關係、模糊邏輯、模糊控制、模糊量測 。
  7. 可跨區的授權資料範圍(考量智慧財產權與 資訊 隱私的因素),以備跨區的 資訊 探勘 。
    文件近似度量測理論延伸關聯運用-近似度分析

原文比較 :Source Text

1 文件近似度量測理論 / 41 (lines)

整合「取樣自動化」、「比對自動化」,安排適當的資訊動線,探勘到使用者所需的目標資訊
Line No. 原文-純文字關鍵字數

1文件近似度量測理論 4  文件 . 似度 . 近似 . 理論 .
2目標   
3資訊近似與差異的量化 3  近似 . 差異 . 資訊 .
4取樣自動化 3  自動 . 動化 . 自動化 .
5比對自動化 4  比對 . 自動 . 動化 . 自動化 .
6自動關聯延伸 3  自動 . 延伸 . 關聯 .
7資訊近似與差異的量化 3  近似 . 差異 . 資訊 .
8要研究資訊文件間的獨立性、從屬性、關聯性、相似度與差異度的量化分析 6  分析 . 文件 . 似度 . 差異 . 資訊 . 關聯 .
9必須先瞭解資訊它所呈現出的樣貌、可能的格式,並設法拆解它 1  資訊 .
10如果我們以一篇資訊文件為個體來研究,其具有標題與內容、作者、時間 4  內容 . 文件 . 資訊 . 標題 .
11標題,是文件的主題句,其文字在整篇資訊中,具有相對較高的關鍵字與索引參考 5  文件 . 有相 . 資訊 . 標題 . 關鍵字 .
12內容,可分段落或區塊,通常以段行區隔,區塊內的句子可用標點符號來辨識 2  內容 . 區塊 .
13內容中的資料可區分成文字與多媒體,分出來的多媒體(一般多為圖片或影片),可依它所在文件中的區塊位置,可透過該區塊的文字來分析多媒體的特性 5  內容 . 分析 . 文件 . 區塊 . 資料 .
14作者,是資訊發行者 1  資訊 .
15可追溯資訊的發行軌跡,找出起始源頭,或散佈節點 2  找出 . 資訊 .
16時間,時間郵戳的分析 1  分析 .
17取樣自動化 3  自動 . 動化 . 自動化 .
18提供必要的工具,再加上適當時機的取樣,建立有意義的取樣規則 2  建立 . 意義 .
19初步取樣   
20要做取樣自動化,一定要先有文字檢索或搜尋引擎,它不只是提供搜尋的功能,輸入的字詞也提供初步取樣的樣本 6  功能 . 自動 . 要先 . 動化 . 搜尋 . 自動化 .
21篩選規則   
22當初步取樣經搜尋後,找不到或者找到太多(多過總文件比例的1/2)或找到少於2個的情形下,都必需先排除,由於設置的是比例,所以它會隨資訊文件的多寡而自動調整 6  文件 . 自動 . 找到 . 搜尋 . 會隨 . 資訊 .
23取樣網篩   
24先設定排除的篩選規則,判斷初步取樣的字詞,如果符合排除規則即無效、即排除取樣,反之則保留成為有效搜尋關鍵字(Search Tags) 5  Tags . 成為 . 符合 . 搜尋 . 關鍵字 .
25取樣關鍵字 1  關鍵字 .
26當存取時,做必要的更新記錄(沒必要的時候不要做,避免執行效率降低),在取樣關鍵字(iTags)資料庫中,依吻合文件量更新排序 7  Tags . 文件 . 更新 . 執行 . 排序 . 資料 . 關鍵字 .
27比對自動化 4  比對 . 自動 . 動化 . 自動化 .
28讀取文件時,進行關鍵字比對,如同 DNA 的概念 4  文件 . 比對 . 進行 . 關鍵字 .
29Tags 列 1  Tags .
30讀取 iTags 後比對目標文件,可以產生一條 Tags 列 4  Tags . 文件 . 比對 . 產生 .
31Ref Tags 2  Ref . Tags .
32當很多不同的資訊被讀取後,分別將他們個別 Tags 列的重要訊息記錄在 Ref Tags 資料庫 7  Ref . Tags . 他們 . 很多 . 訊息 . 資料 . 資訊 .
33比對 Ref Tags 3  Ref . Tags . 比對 .
34用 iTags 去比對 Ref Tags 3  Ref . Tags . 比對 .
35比對規則 1  比對 .
36建立比對積分標準,即近似度比對記分公式 4  比對 . 似度 . 近似 . 建立 .
37自動關聯延伸 3  自動 . 延伸 . 關聯 .
38利用自動資訊探勘,進行自動關聯 5  自動 . 探勘 . 進行 . 資訊 . 關聯 .
39自動資訊探勘 3  自動 . 探勘 . 資訊 .
40整合「取樣自動化」、「比對自動化」,安排適當的資訊動線,探勘到使用者所需的目標資訊 8  比對 . 自動 . 使用者 . 動化 . 動線 . 探勘 . 資訊 . 自動化 .
41定義輸出條件、數量限制、輸出區塊,以顯示延伸閱讀或關聯文件的標題 6  文件 . 定義輸出條件、數量限 . 延伸 . 區塊 . 標題 . 關聯 .

2 延伸關聯運用-近似度分析 / 41 (lines)

自動找出內容接近的相關文章,並根據比對關鍵字的異同,進行近似度分析的量化排序,方便延伸閱讀
Line No. 原文-純文字關鍵字數

1延伸關聯運用-近似度分析 5  分析 . 似度 . 延伸 . 近似 . 關聯 .
2開發延伸關聯運用之前的提問 2  延伸 . 關聯 .
3要先了解延伸什麼?關聯什麼?延伸閱讀的意義何在? 4  延伸 . 要先 . 意義 . 關聯 .
4是什麼原因促使站主想要建立資訊? 2  建立 . 資訊 .
5使用者來訪為的是什麼? 1  使用者 .
6資訊為什麼要用網路來發佈或取得? 1  資訊 .
7資訊與資訊之間怎樣自動產生關係?用什麼方式讓他們自己自然地連在一起? 4  他們 . 自動 . 產生 . 資訊 .
8開發目的   
9尋求同時能服務網站站主、網站讀者雙方面的需求   
10留住讀者,創造較高的點閱率,讓網站建立資訊者的辛苦有價值 2  建立 . 資訊 .
11焦點集中,當閱眾找到某個網頁時,應該對該文有興趣,讓閱眾願意留下來多瀏覽幾頁 1  找到 .
12自動找出內容接近的相關文章,並根據比對關鍵字的異同,進行近似度分析的量化排序,方便延伸閱讀 11  內容 . 分析 . 比對 . 自動 . 似度 . 找出 . 延伸 . 近似 . 排序 . 進行 . 關鍵字 .
13把閱讀網站資訊的過程模擬成旅遊,標籤(Tags)成為使用者的休息站 4  Tags . 成為 . 使用者 . 資訊 .
14出發時,使用者的動線是自由的自主的,享受旅行過程中隨處可得的樂趣 2  使用者 . 動線 .
15使用 Tags 已研發的技術 1  Tags .
16運用 Fuzzy 理論的近似推理(Approximation reasoning),根據自動資訊探勘的結果,處理資訊內容的模糊集合、模糊關係、模糊邏輯、模糊控制、模糊量測 6  內容 . 自動 . 近似 . 探勘 . 資訊 . 理論 .
17Tags Explorer 搜尋標籤訊息列:關鍵字、符合文件數 6  Tags . 文件 . 訊息 . 符合 . 搜尋 . 關鍵字 .
18Refferenced Tags' List of the Headline and Content (ref_tag_hc) 表:文件序號(document_id), 標題關鍵字(idtimesrn_h), 本文關鍵字(idtimesrn_c) 5  Ref . Tags . 文件 . 標題 . 關鍵字 .
19文件近似度量測理論: 4  文件 . 似度 . 近似 . 理論 .
20關鍵詞權重   
21相同度量化分析: 有相同的 Tags [關鍵字a(1/符合文件數)+關鍵字b(1/符合文件數)+...+關鍵字n(1/符合文件數)] ) 6  Tags . 分析 . 文件 . 有相 . 符合 . 關鍵字 .
22差異度量化分析: 不同的 Tags [關鍵字a(1/符合文件數)+關鍵字b(1/符合文件數)+...+關鍵字n(1/符合文件數)] ) 6  Tags . 分析 . 文件 . 差異 . 符合 . 關鍵字 .
23資料完整性: 1  資料 .
24相同度量化=相同度量化分析 * (相同關鍵字數/總關鍵字數) * 10000 2  分析 . 關鍵字 .
25差異度量化=差異度量化分析 * (不同關鍵字數/總關鍵字數) * 1000 3  分析 . 差異 . 關鍵字 .
26近似度分析與排序:相同度量化-差異度量化 5  分析 . 似度 . 近似 . 差異 . 排序 .
27延伸關聯的自動化 5  自動 . 延伸 . 動化 . 關聯 . 自動化 .
28把繁複的比對與計算交給程式,由它自動化處理 4  比對 . 自動 . 動化 . 自動化 .
29當顯示 Tags Explorer 時,產生 ref_tag_hc list,檢查該資料的 Tags List 是否存在 或 是否需要更新 5  Ref . Tags . 更新 . 產生 . 資料 .
30可跨區的授權資料範圍(考量智慧財產權與資訊隱私的因素),以備跨區的資訊探勘 3  探勘 . 資料 . 資訊 .
31設立近似度比對記分公式,依此比對 ref_tag_hc 資料,並做分類與排序 6  Ref . 比對 . 似度 . 近似 . 排序 . 資料 .
32定義輸出條件、數量限制、輸出區塊,以顯示延伸閱讀或關聯文件的標題 6  文件 . 定義輸出條件、數量限 . 延伸 . 區塊 . 標題 . 關聯 .
33延伸閱讀程式設計 1  延伸 .
34本程式「延伸閱讀」從理論到開發完成,因為之前已經累積很多的核心技術,因此只需三天便達成 3  延伸 . 很多 . 理論 .
35實際功能目前正在執行與測試改良中 2  功能 . 執行 .
36延伸閱讀註解說明: 1  延伸 .
37比對:比對這個字下面有個數字,它代表可供比對資料的探勘次數,精確度會隨比對數字變大而提高 4  比對 . 探勘 . 會隨 . 資料 .
38延伸閱讀標題括號內的數字:表示經過自動比對後的近似強度 5  比對 . 自動 . 延伸 . 近似 . 標題 .
39滑鼠移到延伸閱讀標題時,顯示的註解:提示該文與本文相關聯的相同點(Tags)與其(數量) 4  Tags . 延伸 . 標題 . 關聯 .
40跨區比對:會有代號在前,例如 ab999: xxx 1  比對 .
41可引用此項技術來開發-交叉比對 XR (cross-reference) 2  Ref . 比對 .

搜尋標籤比對 :Search-Tags

共同項搜尋標籤 Common Search-Tags
文件近似度量測理論延伸關聯運用-近似度分析
資料   搜尋   理論   自動化   自動   比對   分析   Tags   (8)

搜尋標籤比對 :Search-Tags

不同項搜尋標籤 Different Search-Tags
文件近似度量測理論延伸關聯運用-近似度分析

研究發展-方向與目標 網路名片 My iCard

« 研究發展-方向與目標 » 開發智慧型網路程式設計,提供用戶多功能、系統化的網路整合通訊價值 We Keep it Simple and Smart !
經過 6884 次比對. 系統效能分析 1 wallclock secs ( 0.22 usr 0.01 sys + 0.00 cusr 0.01 csys = 0.24 CPU)
© XR powered by areA Web Tech.