Search Tags 搜尋標籤研究與運用- 相關分類
e化專欄 more 基礎 研究發展
|
 |
 |
 |
什麼是 Search Tags 搜尋標籤?
順著所需的廣度或深度,自由自在地遊走。

|  憑著一個方向,就可以去探索去發現 To Explore tag by tag |
|
Search Tags 搜尋標籤 讓 程式 有 閱讀能力 資訊內容是作者透過 word by word 的產生,而形成的一個獨立的數位文件,這個文件如果我們用化學的觀念來解構時,可做出這樣的分析─「文件是由各個段落所組合而成的聚合物,每一個段落是由數個句子組成,句子就像是一個分子,裡面的字就好比是原子」。當我們要來比較文件的近似與差異度時,掌握其主要成份異同,就是最清楚又最簡單的標準。 重要的成份就是重要的元素,只要能找出來已知的元素,比較一下對方是否也存在?相同的元素多不多?其間的關係與關聯性自然就出來了。
Search Tags 搜尋標籤 成為導航員 當然在文件裡,元素就是原子,原子就是字。如果針對所有的字,那就太低路啦也太沒效率。至於那些字是重要的?可以透過站內搜尋引擎(站內檢索)的記錄中獲得,來找出重要的字(關鍵字),運用關鍵字 (keyword) 來協助建立資料之間的關係,這個特定的關鍵字即是搜尋標籤 ( Search Tag or Tag ),目的要讓探索者 (Explorer) 在閱讀資訊或資料庫時,順著他自己所需知識的廣度或深度,自由自在地遊走,更方便地在知識上取其所需。Search Tags 需要搭配搜尋引擎 (Search-Engine) 做為輸入、輸出 (STDIN、STDOUT) 重新導向的傳遞工具。
Search Tags 搜尋標籤(資訊探勘標籤)
 | Rules and Usage 搜尋標籤需要定義規則與使用條件 |
The Search Tags Rules
- Tags 需要與不需要
先過濾一些沒有意義的字,沒有必要讓它產生一些壞的 Tags,再留給後人刪除。
- Tags 的產生與不產生
任何一個 keyword 都可能成為 Tag,但需經過搜尋引擎的檢驗。不需要預先準備一個不存在的 Tag,當搜尋符合文件數量少於 minmun=3,因為文件過少;當數量大於 Total 1/3,因為文件過多,會造成效率變差所以不產生Tag。 一個中文字的 Tag,會在 eUnit 的站上顯示,為了避免造成過多的 Tags 列,當在系統內瀏覽到此 Tag,故不顯示。
- Tag 可能造成系統或程式設計的新問題
衝碼、執行效率、導向介面、資訊累積(只新陳無代謝)的因應,因此需要持續的程式設計與部份手動管理。
The Search Tags Usage
- 好的 Tags 與壞的 Tags 的差異
好的 Tags 搜尋吻合的資料數不會超少也不會超多。 好的 Tags 是文件的重要關鍵字,如同推理的證據、檢驗的切片、重要成份,它們具有一定的樣本意義。
- Tags 的管理
配合自動通報系統 ENS,當 Tags No Found 累積達固定的數量時用 email 通知站長 Search Tags Report。 新的 Tag 產生要用 ENS 自動通報站務人員。 無效率的 Tags,可以用搜尋標籤管理的功能將其刪除,管理權目前與WLEC同屬相同單位,來授權管理。
- Tag-Groups 的形成,由系統根據 Tags 的集合關係,產生 Tag-Group,做為從屬關聯的資料採礦 (Data-Mining) 路標化工具。
根據 Tag 的相似度所產生的 Tag-Group(s)。例如 A, AB, BC, ABC 的 四個 Tags,會有三個母級的Tag-Group,包括A組(A,AB,ABC),AB組(AB,ABC),BC組(BC,ABC),而且 Tag-Group A 為 Tag-Group AB 的母級 Group,所以A變成祖母級的 Tag。
- Tag 使用的語言特性
英文句的每個字都有空白間隔,但中文句的字彼此相連,keyword 夾在字前字後的判斷會有差異。
- tagid 解決使用端採用非預設的語言介面
使用某個已存在的 Tag, 其值以 tagid 替代,可避免非預設語言區的使用者,在輸入與輸出間重新導向產生的錯誤。
Search Tags 搜尋標籤開發重點 與 KM 知識管理的比較
Depth of Focus: Tags and KM
KM 是屬於規劃性的
 Tags 是比較實證化的經驗 |
|
- Tags 與 KM 之間的特性與差異
Tags, KM 都是資訊探勘與知識探勘的重要工具,Tags 需要配合搜尋引擎才能運用;KM 需要由系統建立索引資料庫或關聯資料庫,搭配網站後端管理才能啟動。 KM 是屬於規劃性的,比較有導入與歸納的索引特質,用在可族群化資訊的區隔與資訊社群的分類;Tags 是比較實證化的經驗累積,採用共通的語句,來找出資訊的交集與共同點。 KM 與 Tags 產生的經過與程序差異:KM 的產生與定義是由結構組織者 (e-organizer) 與資訊發行人 (e-publisher) 決定;Tags 則是由讀者透過搜尋引擎搜尋關鍵字,經系統查詢比對後,如果符合 Search Tags Rule、Search Tags Usage 即產生。
插圖說明:
KM 是屬於規劃性的 要幾根電線桿?粗的細的要分清楚?電從那裡接過來?又從這裡接到何處?
Tags 是比較實證化的經驗 先找根電線桿,確認是否有電,電量多少。
|
Development: Search Tags Tech. 搜尋標籤開發比較
eBay vs areA Web Tech.
- eBay 的搜尋標籤是作者寫完文件後,作者再設定 Tags,Tags 的數量由eBay決定,然後使用者再輸入關鍵字來找 Tags,在導向至相關文件。可參考 http://pages.ebay.com.hk/help/account/search-tags.html
- areA Web Tech. 搜尋標籤的作法是當作者寫完文件後,不用再自己建立 Tags,而是使用者在搜尋某關鍵字後,系統自動會根據搜尋結果判定是否產生 Tags,讀者在瀏覽網頁資料時,系統會自己抓關聯的 Tags,產生一個 Tags 列,讓使用者直接點選。
WIKI vs areA Web Tech. wiki 的詞條作法與 areA Tags 的不同
- wiki 詞條的作法
透過適當的位置先由資訊發行者產生詞條,系統可以依照位置的關係來定義資訊的從屬關聯,資訊發行者再透過詞條來衍生新的文件與資料。
- areA Search Tags 搜尋標籤的作法
已經先有的各個文件(資訊發行者透過工作平台產生),Tags 則是由讀者在使用搜尋引擎時觸發產生,同時各個文件則因此含有不同的 Tags,讀者可透過 Tags 瀏覽列來延伸閱讀,Tag-Group 也是由系統自動產生,可做為資訊探勘的路標工具。
搜尋標籤與站內搜尋引擎的延伸與開發定位
areA Web Tech. 資訊搜尋的設計定位
把自己的搜尋與探勘系統做到最好,其他的外部搜尋的工作,放心地交給Google;不要浪費設計與開發資源。

- 強化網站內部搜尋引擎與執行效率。
- 定義好的 Tags' Rules。
- Tags 由使用者定義,通過 Tags' Rules and Filters 後自動產生。
- Tags 由使用者例外名單 (by userip)
- Tags 資料庫與過濾器由授權單位以人工管理。
Keep IT Simple and Smart !
延伸運用
(本站已設計完成並運用 KM 與 Search Tags,並不斷地根據實務進行改良我們的網站系統) areA Web Tech. 前線網路科技 R&D

Tags
| 知識探勘 , 衝碼 , 站內檢索 , 線上工具書 , R&D , 站內搜 , wiki , 授權管理 , user , eUnit , Tags , 知識管理 , 標籤 , WLEC , 比對 , KM , 後端 , ENS , 搜尋引擎 , SMART , 工作平台 , 站長 , search , 組織 , google , 前線網路科技 , 結構 , Mail , 程序 , 分析 , 程式設計 , 效率 , 分類 , 資料庫 , 圖 , web , 自動 , areA , 系統 , |
作者管理 e化專欄編輯 | e化專欄分類編輯 (技術開發)
|