e化專欄 more 專業人士 研究發展
|
 |
 |
 |
|
 技術開發開發時需要不斷地測試,才能找出改善的方法。解決問題與提升效能後,才可能成為 Core-Tech。
|
| | |
開發目的
在科幻片(FRINGE 危機邊緣)中,常聽到 Cross-Reffernce 交叉比對。經過交叉比對後,往往可以找出蛛絲馬跡,很可以運用在當今的資訊時代。
- 進入數個原始文件,由程式自動去挖出關聯性,交叉比對資料後,把關係呈現出來。
- 開發出 XR) Cross-Reffernce,它可以從一般資料,不限是否在資料庫格式,只要把數個文件資料投入,它就自動分析。
- proto-type 已經開發出來,現在持續測試改良中。
- 可加上手動的 XR Filter 交叉比對-手動文件過濾器。
交叉比對運用案例與實驗
文件經比對程序,進行自動交叉比對,下面的 Demo 是把比對結果以htm存下來。 Demo: 使用程式比對出來的結果
開發交叉比對之前的提問
當已經找到相關的文件後,要如何比對兩個文件資料?什麼叫交叉?比對?
- 如何在原始資料中,找出待比對的資料?單位應該用什麼?如何切割?
- 既有的系統能提供什麼?或那些應用可做為基礎?功能上如何整合?
- 異同處的自動比對如何量化?或產生關聯?
- 提供什麼輸入?或使用者輸入些什麼?讓比對程式使用。
- 如何導引到程式自動學習?
- 資訊與資訊之間的人工智慧運用,要加多少的手工?多少的人工?能累積嗎?能自動化或半自動化嗎?
Proto-Type XR 研發要點
Take it Easier / Look it Clearer / Match it Closer / Dig it Deeper / Work it Wider / Speak it Louder
- Take it Easier 透過延伸關聯找出可供比對的原始文件。
- Look it Clearer 用 AutoPilot 來切割,以 Composition: Paragraph / Sentence / Words 解構, 以 line 做為單位。
- Match it Closer 用 Common Tags 做同項比對,Dif Tags 做不同項比對。
- Dig it Deeper 從每個 line (Sentence) 內找出新的、具有比對意義的 keywords,並根據此來比對它的異同。
- Work it Wider 把近似的 keywords 組成 Packages,未來可對於符合近似度的資料做分類。
- Speak it Louder 自動組成文字、文句,提供交叉比對的分析結論。
在夾雜中英文多種語言的文字處理
處理文字的方式不同。
- 因為不同國家的文字在語言文化、章法、結構、組織與意義不同,所以中英文必須分開處理,但仍有衝碼可能。
- 電腦不懂英文單字,也不知道中文字堆疊的意義,只能初步讓他們先分開成兩個部分,拆開後分別處理。
- 程式處理句子時,中文的比較簡單,因為可用標點符號來判斷。
- 要找出英文的句子,較不容易,因為英文的句號是(.),但縮寫單字、小數點數字、等例如Mr. 21.7 易混淆。
- 處理單字時,英文較容易,只要用空白來split,細節的部分包括大小寫、排序、標點符號等。
- 找中文單字時,必須考慮字的組合關係,比較麻煩,要用逐字探勘的方式來比對,因此需要更多無法減少的迴路,也造成所需執行時間較長。
逐字比對的硬體需求
- 高性能的電腦:做逐字比對,執行程式時會有大量的迴路(Loop)程序,多文件且內容多時,需要高性能的電腦。
- CPU負荷評估:約一般程式的100倍以上,搭配執行效能高的處理器,可縮短比對等待時間。
- 來源資料庫:投入方式可手動(typing, copy and paste),或經編寫程式,自動倒入。
- 以最簡迴路設計讓負荷減輕。
導引到程式自動學習(待開發)
理論基礎:透過半手動的關鍵字群組產生例如像 Layer , Package 這些具有組成意義與相對性的矩陣,可做彈性延伸它的知識背景,讓程式用統計的量化與近似推理 (Approximation reasoning),以 FUZZY 的方式學習。
- 角色:家庭(父親、母親、夫、妻、兄、弟、姐、妹、子女、祖先、後代)、學習(老師、同學、學生)、工作(職業、上司、同事、下屬、同業)、
- 年表 (Chronology):民國、西元、出生日、幾歲
- 外形:尺寸(長、寬、高、深)、體型(高、矮、胖、瘦、身高、體重、三圍)、形狀(長、低、高、圓、尖、鈍、扁、粗、細)、狀態(固態、液態、氣態)、量(多、少)、顏色(RGB)
- 區域:地理(洋、山、河)、地域(洲、國、州、省、縣、市、鄉、鎮、區、里、路)
延伸關聯技術的運用-交叉比對
文字資訊檢索(Text Retrieval) 、文件資料交叉比對(To cross-refer Documents),例如交叉比對兩人 << 李遠哲 | 陳澄波 >> 做為研究範本 case proto-type: Lee and Chen XR, abr. LC-XR or LCXR
- 關聯資料庫管理系統 RDBMS(Relational database management system):A table can have an xref as prefix to indicate it is a cross-reference table that joins two tables together via primary key.
- 交叉比對 :cross-reference (noun), cross-refer (verb) 英文縮寫 x-ref, xref, or, 計算機科學領域簡寫為 XR。關聯性量化分析。
系統與應用程式整合
- icard var 通用名稱與參數設定
$ihome_more_cgi{xr}=交叉比對
- max var: allow ? 是否允許客戶使用?
$xr_allow_all,%xr_allow
- my var: Customized name to be modified 應用程式名稱命名
- tag common ref: item page's tags relative-links 單頁關聯XR比對URL
$url_xr_cnsa
- is cn: item page's app link 單頁應用程式URL
- is sa: item page's app link 單頁應用程式URL
- xr 比對用主程式
- xr op 名單挑選用程式
- xr css
- counter
- what's new

Tags
| 衝碼 , 延伸關聯 , 待開發 , 理論 , AutoPilot , ERB , 交叉比對 , 行程 , 科學 , Tags , 硬體 , 統計 , 自動化 , 研發 , 效能 , 應用程式 , 知識 , LOG , 組織 , 結構 , 程序 , 分析 , iCard , 整合 , 分類 , 時間 , 資料庫 , 客戶 , 設計 , 智慧 , 系統 , 管理 , |
作者管理 介紹說明編輯 | e化專欄分類編輯 (技術開發)
|