祝!WordPress Related Post for Japanese

いやぁ、できないことなんてないのですね。 :wink:

>bsuiteの漢字tagのRelated問題について

bsuite.php の relatedの漢字問題なのですが、おそらくこれはMySQLの問題です。WPの検索フォームでも同様の問題が起きるのですが、現在のMySQLは漢字を含む検索が下手なのです。MySQL のフルテキストインデックスという機能です。
<中略>
日本語は英語と違って単語の間に区切りがないので、その辺が検索系のソフトをつくると問題になるんですね。1文字ずつ調べると恐ろしく処理に時間がかかりますし..

とその昔、ひろまささんは言ってました。当時は今以上に知識がなく、ちんぷんかんぷんでしたが、ひろまささんにできなければオレにできるわけがないという結論でした。(それは今も変わらんし)こういう問題で関連記事を引っぱってこないのかどうかわかりませんが、関連記事を引っぱってくる系のプラグインは同じカテゴリかタグからテキトー(殴)に選択している感が否めませんでした。

しかし、某秘密機関では実用化をあきらめてないので、いつの日か実現できるその日までご一緒に待ちましょうぞ>SA・GAさん。

テルミナさんと誓った?のは2006年。そして、2年半後に彼はついに実現させたのでした。

>WordPress Related Post for Japanese

Yahoo! Japan が提供する日本語形態素解析APIを利用して、WordPress の投稿をアナライズし、自動的に投稿の下部に「関連する記事」へのリンクを付与するプラグインです。

スバラシイ。逆にいうとやはりMySQLでは解決できない問題なんだなと感じます。それにしても、プラグインを有効化してプロダクトIDを入力するだけとは恐れ入る。簡単すぎる! 個人的には関数を利用して任意の場所に表示できるようになればサイコーなんだが、それはあまりに小さな問題だよな。 :lol:

【追記】
おっとそうそう、v2.5.1なんですが、動きます。 :shock:

スポンサーリンク
  • このエントリーをはてなブックマークに追加

コメント

  1. テルミナ より:

    とテルミナさんと誓った?のは2006年。

     あっははは!
     こちとら、すっかり記憶の彼方に吹っ飛んでおりました(爆)。 :lol:

     でも、確かにそんな話していましたねぇ。

    スバラシイ。逆にいうとやはりMySQLでは解決できない問題なんだなと感じます。

     MySQLの全文検索機能も、検索語句の重み付けを出来たりしてなかなか面白いのですが、単語レヴェルでの正確さが要求される検索にはやっぱり向きませんね。

     そういえば少し前、確か国が日本独自の検索システムを作ろうなどと気勢を上げていたような気がしますが、成功の鍵は形態素解析でしょうね。
     とは言っても、日本語圏でしか通用しない概念なのでしょうが。

  2. ゆりこ より:

    いえいえ、形態素解析は「品詞を判断する」ことも含めたものなので、英語などすでに分かち書きされた言語でも存在する概念ですよ。ただ、日本語・韓国語・中国語などでは分かち書きされていないところが難しいわけですが。

    形態素解析を正確に行うには、新語や固有名詞の判断がキモでしょうね。すべて漢字・すべてカタカナの単語は比較的簡単なんですが「モーニング娘。」のようなものはあらかじめ辞書に入れてないと「文末」と判断されてしまいます。

    あと、検索で難しいのは適合率と再現率のバランスで、適合率を上げつつ (ハズレを少なくしつつ)、漏れを減らす (再現率を上げる) のが難しいことです。今の検索エンジンは再現率を重視している節がありますよね。

  3. Masayan より:

    すごいなぁ、お二人とも。 :)

    さすがに素人のおじさんにはついていけない世界です。でも、プラグインフォルダに入れて有効化すれば使えるんですよねー。これまた、すごいことです、まったく。 :o

  4. ゆりこ より:

    でも、プラグインフォルダに入れて有効化すれば使えるんですよねー。

    まさにこれがすごいところで、現代の科学技術は「魔法」に近いレベルだと思えます。コンピューターや携帯電話はそれの究極でしょうか。しまいに「姿を隠すマント」も光学迷彩として実現するかもしれません。

  5. テルミナ より:

    すごいなぁ、お二人とも。

     家々。私なんぞは素人に毛が生えた程度でございます。
     現に、

    いえいえ、形態素解析は「品詞を判断する」ことも含めたものなので

    などとご指摘をいただいておりますし。

     まあ、MySQLの全文検索は仕事で使っていたりもしますけどね。

    「姿を隠すマント」

     どっかの国の軍隊が、もしかしたら本気で研究しているかも知れませんね。

  6. ゆりこ より:

    どっかの国の軍隊が、もしかしたら本気で研究しているかも知れませんね。

    光学迷彩は実際に研究が進んでいますよ。日本でもやってて、再帰性投影技術 (東京大学舘研究室) が有名ですね。

  7. Masayan より:

    いや、ホントにすごいなぁ、お二人とも。 :)
    みなさん、何気に物知りだと思うんですよ。結構な刺激を受けますね。

    良きことかな、良きことかな。 :mrgreen:

コメントをどうぞ

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

:x :wink: :twisted: :shock: :sad: :oops: :o :mrgreen: :lol: :idea: :evil: :cry: :cheesy: :arrow-u: :arrow-l: :arrow-d: :D :?: :) :!: 8)