MySQL 內建的 FullText Engine 不支援中文是眾所皆知的
在 5.0 版之後 , 有所謂的 plugin 功能 , 其他非官方的人可以寫 plugin 去加強 MySQL 功能
而在 FullText 的部分也有人去寫
例如 Spinx ( http://sphinxsearch.com/ ) : 這套號稱支援中文全文索引 , 支援 myisam 及 innodb , 不過我還沒試 , 但好像不是同步作索引
另外我要介紹一個網站 http://sourceforge.net/projects/mysqlftppc/
這裡面有很多種 FullText Plugin , 其中有個叫 bigram 的支援中文喔 , 必須在 mysql 5.1 版以上運作
比較麻煩的是 , 要自己編譯 , 我在 FreeBSD 及 Linux 上都可以正常跑
大概拿公司的數據 80 萬筆資料(原始資料用了200M空間) , 欄位是 TEXT 的資料來做全文搜尋字串"三國志" 好了, 大概花了 0.02 秒 , 如果用 LIKE %三國志% 的方式 , 會花上 0.7 秒 .... 這真的是太驚人的效能
但 bigram 有個缺點是 , 索引佔用的空間挺大的 , 所以空間要備足
由於這個 plugin 是即時的索引 , 所以一有資料新增 , 馬上就能搜尋 , 大家可以試試看喔
請問一下您的 Mecab 和 ICU 有安裝嗎?
我弄不太清楚要如何開啟同步索引功能。
謝謝。
@rogerger.py
mecab 是甚麼我不知道
你可以看我最新的安裝說明喔
https://www.pigo.idv.tw/archives/353
還有. bigram 本來就是同步索引了 , 不需要額外開啟
請問有否試過安裝在Window? 我真接下載 .so 在Win32裡安裝不了…
那個沒試過喔. 不過你怎麼會有 .so 呢 ? 我記得要自己編譯啊 … , .so 檔應該是 Linux 用的吧
@pigo
謝謝回覆,那應是bi_gram 的一個分支在
http://sites.google.com/site/mysqlbigram/home
提供了一個可在i386使用的 .so
不過我不知道可否在 Window 中使用
在window 的mysql 執行 install plugin 時報不能開啟該檔案,但查 Process Activities 時有發現 Mysql 是有開啟該檔案的…應是錯誤訊息沒準確報出問題所在。
那個不是 win32 版的