SSブログ
P2P検索エンジン YaCy ブログトップ
前の8件 | -

"YaCy" が安定性向上のアップデート配信しました。 [P2P検索エンジン YaCy]

->->
[2017年6月15日追記]
私の環境で最新版のYaCyがCPU負荷100%になってしまう現象が確認されました。
この件についてバグ レポートを致しましたところ、回答を頂きました。
どうやらSolrの問題だそうで、私のデータが大き過ぎる為に引き起こされる現象であるようです。
私の現象の場合、 " yacy/defaults/solr/solrconfig.xml " というファイルの " <str name="buildOnStartup">false</str> " という項目に " <searchComponent name="suggest" class="solr.SuggestComponent"> " と書き加える事により問題が解消致しました!
<-<-

先日、P2P通信技術による分散型インターネット検索エンジンである " YaCy " (ヤスィー)のアップデートが配信されました。
YaCyのヴァージョンは、 " 1.921/9236 " となっております。
このヴァージョンでは全文検索エンジンがSolr 6.6へヴァージョン アップしております。

注意点と致しまして、このヴァージョンではJava 8が必要となっております。Java 7以前のヴァージョンのJava VMを利用している方は最新のJava 8をインストールしてからYaCyをアップデートするようにして下さい。

Java 8が利用出来るようにした後、既にYaCyを利用している方は、管理画面から最新のリリースをダウンロード、インストールしてアップデート出来ます。
未だYaCyをインストールしていない方は、まず公式ウェブサイトよりヴァージョン 1.92をダウンロード、展開、立ち上げてから同様に管理画面より最新版にアップデート出来ます。

私はYaCy 1.921/9236へアップデートしたところ、以前は時たま " UNRESOLVED PATTERN " というエラーが出る事があったのですが、この様な不具合は無くなりました。

また、YaCy Grid (YaCy/2)の開発も進んでいるようで、今後数ヶ月以内に利用可能になるようです。

"YaCy" の公式 "Twitter" アカウントのURL:
https://twitter.com/yacy_search

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

[ブログ記事]
分散型検索エンジン "YaCy" が正式に日本語化されました。
http://crater.blog.so-net.ne.jp/2016-02-25

検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06

"YaCy Grid" (YaCy/2)は "Elasticsearch" を使用するとの事。 [P2P検索エンジン YaCy]

私が何年も前から使用している、P2P通信技術による分散型インターネット検索エンジンである " YaCy " (ヤスィー)の次期ヴァージョンの開発が順調なようです。

次期ヴァージョンは今までYaCy/2と表記されておりましたが、YaCy公式Twitter アカウントによりますと、この度、 " YaCy Grid " (ヤスィー グリッド)が正式な名称として決定したようです。

"Twitter" 上の当該ツイートのURL:
https://twitter.com/yacy_search/status/846623428023062529


また、この " YaCy Grid " は今までのYaCyから大幅な改良が行われるようですが、それにも関わらず以前のYaCyをしっかりとサポートしてくれるものになるそうです。

"Twitter" 上の当該ツイートのURL:
https://twitter.com/yacy_search/status/846624500103942144


開発スケジュールは次の画像の通りです。
YaCyの開発スケジュール画像。

開発が予定通りに順調に進めば今年2017年の8月頃に " YaCy Grid " の開発が完了することになるようです。
2017年3月31日現在、日本のYaCy利用者が少し増えてきてくれているので、この次期ヴァージョンのYaCy Gridによって更なる利用者の拡大が実現すれば素晴らしい事です。
今後が非常に楽しみです。


ところでこの " YaCy Grid " では幾つかの注目すべき新要素がございます。
それらの新要素を紹介致します。

[Elasticsearch]
今までのSolrに代わって " Elasticsearch " という、2017年3月31日現在最も人気のあるオープンソースの検索エンジンを採用するようです。
ElasticsearchとSolrはどちらも全文検索ライブラリーとしてはApache Luceneを使用しているそうですが、ElasticsearchはSolrよりも分散型検索に向いており、また、分析性能が優っているそうなので、Elasticsearchを導入する事により、P2P ネットワークによる分散型検索の効率が上がり、また、検索結果もより良いものが得られるようになりそうです。

オンライン百科事典 "Wikipedia" の "Elasticsearch" のページのURL:
https://ja.wikipedia.org/wiki/Elasticsearch

[WARC]
" WARC " という国際標準化機構(ISO)の定めるウェブ アーカイヴの保存形式を採用しているようです。

オンライン百科事典 "Wikipedia" の "国際インターネット保存コンソーシアム" のページのURL:
https://ja.wikipedia.org/wiki/国際インターネット保存コンソーシアム

オンライン百科事典 "Wikipedia" (English)の "Web ARChive" のページのURL:
https://en.wikipedia.org/wiki/Web_ARChive

[RabbitMQ]
" RabbitMQ " というオープンソースのメッセージ指向ミドルウェアも採用するようです。

オンライン百科事典 "Wikipedia" (English)の "RabbitMQ" のページのURL:
https://ja.wikipedia.org/wiki/RabbitMQ

[Apache FtpServer]
" Apache FtpServer " を利用するようです。
これは、Apache (アパッチ) ソフトウェア財団のオープンソース ソフトウェア プロジェクトの1つである、 " Apache MINA " というネットワーク アプリケーション フレームワークに基づくFTP (File Transfer Protocol / ファイル転送規約) サーヴァーです。

"Apache FtpServer" プロジェクトのウェブサイトのURL:
http://mina.apache.org/ftpserver-project/

YaCy Gridはこれらの優れたオープンソースのシステムを採用し、より進化したものとなることでしょう。


"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

[ブログ記事]
分散型検索エンジン "YaCy" が正式に日本語化されました。
http://crater.blog.so-net.ne.jp/2016-02-25

検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06

Googleが検索結果の順位付けをモバイル向けサイト中心にするそうです。 [P2P検索エンジン YaCy]

Google社からインターネット検索サーヴィスに関する非常に重大な発表があったそうです。

"INTERNET Watch" の記事 "Google、検索インデックスでモバイル版コンテンツを優先する変更を発表" のURL:
http://internet.watch.impress.co.jp/docs/news/1028566.html

ImpressのINTERNET Watchの2016年11月7日の記事によりますと、インターネット検索エンジンで最大のシェアを持つGoogle社が、今後はインターネット上のコンテンツの検索結果の順位付け(ページランク評価)及び、索引(インデックス)を作成する際のコンテンツの構造化データ解析や、検索結果へのスニペット表示の為に、デスクトップ端末向けのサイトやページではなくモバイル向け(スマートフォン向け)に作られたサイトやページを中心に使用するようにアルゴリズムに変更を加えるとの事です。

この変更による変化は、検索サーヴィスの利用者から見ると、検索結果ページの最初の方のページかつページの上位にモバイル向けサイトが来るようになり、デスクトップ向けサイトは後の方のページかつページの下位に表示されるようになる事が予想されます。
また、コンテンツ作成者及びウェブサイト所有者から見ると、モバイル向けに最適に作られていないサイトはアクセスが激減する可能性があるものと想像されます。
デスクトップ版のウェブサイトのみを作成しており、スマートフォンなどのモバイル向けに最適化していない場合には非常に困る事になるかもしれません。

Google社は自社の検索サーヴィス利用者の内、モバイル端末からの検索が多数を占めるようになった事から、検索サーヴィスを多数派のユーザー向けに最適化する事にした訳です。

しかしながら、モバイル端末の世界は少数のキャリアとOS メーカーによってほぼ完全に支配されており、利用者の情報は何から何までほとんど全て収集、分析し、プロファイルとして管理し、場合によっては企業同士や政府にさえ個人情報を渡しているとされています。
アメリカのCIAなどは通信内容さえ覗き見ているという証拠があり、その証拠の一つがあの有名なスノーデン ファイルです。
同様に少なくともアメリカなどの警察組織もモバイル端末内のデータや通信履歴などを見る事が出来るそうです。
今後デスクトップ端末及びデスクトップ端末向けのウェブサイトやインターネット コンテンツが廃れてしまえば、世界中の人々がそうした特定の大企業の支配下、管理下に置かれてしまう事となります。
これは非常に危惧すべき事態であると思います。

ここへ来て、P2P通信技術を用いた分散型インターネット検索エンジンである " YaCy " の重要性が急上昇して来たのかもしれません。
YaCyはドイツの人々が中心となって開発して来た検索エンジンです。
私は何度も同じ事を書きますが、YaCyを利用する事により、国家や企業によるインターネットの検閲、不正、不当なフィルタリングを防ぐ事が可能です。
加えて、もしもGoogleやMicrosoftがYahoo!のようにインターネット検索事業を放棄してしまったとしても、YaCyがあれば世界のウェブサイトを検索する事が可能です。

以下は暫く前のヴァージョンのYaCyのスクリーンショット画像です。ブラウザーはFirefoxです。
YaCy_SS_(2015_06_25)_1_Edited_1 分散型インターネット検索エンジン "YaCy" のスクリーンショット画像。検索結果の一覧が表示されている。
https://c1.staticflickr.com/1/751/22190971565_8a57afc081_o.png

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

私のYaCy ピアには既に30,000,000以上のインターネット上のコンテンツの索引がございます。
どうぞYaCy検索エンジンを御使用下さい。その際は1日当たり30分位からでも良いですので、根気強く長期的に御使用下さい。


YaCyの導入の仕方やアップデートの仕方等につきましては以前の私の記事を御覧下さい。

[ブログ記事]
分散型検索エンジン "YaCy" が正式に日本語化されました。
http://crater.blog.so-net.ne.jp/2016-02-25

検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06


" YaCy " の開発用GitHub ページのURL:
https://github.com/yacy/yacy_search_server

私のPCの "YaCy" ピアが保持するドキュメント数が30,000,000を超えました。 [P2P検索エンジン YaCy]

私はP2P通信技術を用いた分散型インターネット検索エンジンである " YaCy " を長く利用しており、これまで沢山のウェブサイトをクロールさせ続け、また多くの他のYaCy利用者達のピアから多くのRWI (Reverse Word Index)とDHT (Distributed Hash Table)を受け取り続けました。

そして遂に、私のPCのYaCy ピアがインデックスを保持するドキュメントの数が30,000,000を超えました。
この数は全YaCy ユーザーの中でも上位に入る数です。3千万ドキュメントもの索引が私のPC端末内にあるというのは、感慨深いものです。加えて、先程の時点でネットワーク上にあるピアの中でのRWIの数では何と、私のピアが世界一となったようです。
それにより現在私のPCでは、YaCyの検索エンジンだけでも大抵の事は検索出来るまでになりました。

私のPCは内蔵HDDのみでSSDが無いのでローカル インデックスの読み出しに少しの時間が掛りますが、それでも日常的な使用で不便はございません。
もしも今後、私のPCに大容量のSSDを追加したならば、一瞬で検索結果が表示出来るようになることでしょう。

只、惜しむらくは日本人のYaCy利用者が未だに増えない事です。
利用者が増えなければ索引データが充分には共有されず、高品質な検索が出来ません。
逆に利用者が増えて来ると、多くの索引データが共有され、高速かつ高精度な検索結果を得られるようになります。

どうか、日本人のYaCy利用者が増えてくれる事を願います。

YaCyを利用する事で、国家や企業によるインターネットの検閲、不正、不当なフィルタリングを防ぐ事が可能です。
それに、たとえいつの日かGoogleやMicrosoftがYahoo!のようにインターネット検索事業を放棄してしまったとしても、YaCyがあれば世界のウェブサイトを検索する事が可能です。

因みにYaCyの開発はドイツの人々が中心になって行って来ました。

ところで、YaCyを利用する内に次第に日本語の検索結果が増えて行き、自分のピアのインデックスの数が増えて行く様子を観察するのも楽しいものです。
人々に必要とされるであろうウェブサイトをクロールする事で、そのクロール対象のページ内に貼られた外部へのリンクを伝ってリンクからリンクへとYaCyが巡回して行きます。
そのクロールしている様子を観察する事も出来ます。

YaCyは根気強く、気長に利用して下さい。


以下は暫く前のヴァージョンのYaCyのスクリーンショット画像です。ブラウザーはFirefoxです。
YaCy_SS_(2015_06_25)_1_Edited_1 分散型インターネット検索エンジン "YaCy" のスクリーンショット画像。検索結果の一覧が表示されている。
https://c1.staticflickr.com/1/751/22190971565_8a57afc081_o.png

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

YaCyの導入の仕方やアップデートの仕方等につきましては以前の私の記事を御覧下さい。

[ブログ記事]
分散型検索エンジン "YaCy" が正式に日本語化されました。
http://crater.blog.so-net.ne.jp/2016-02-25

検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06


" YaCy " の開発用GitHub ページのURL:
https://github.com/yacy/yacy_search_server

最新版の "YaCy ver. 1.90" は "Java 8" が必要です。 [P2P検索エンジン YaCy]

P2P通信技術を用いた分散型の検索エンジンである " YaCy " のメイン リリースの最新版である、 " YaCy 1.90 " がリリースされました。
この最新版では、今まで公式ウェブサイトで配布されていた " ver. 1.82 " と比較して非常に多くの改良が施されております。
機能の向上と速度の向上が幅広く行われました。

過去に古いヴァージョンを使用して不充分だと感じた方も、最新版ではこれならば利用出来ると感じるかもしれません。

最新版である " ver. 1.90 " は " Java 8 " で動作致しますので、PCに " Oracle JDK 8 " , " Oracle JRE 8 " , " OpenJDK 8 " , " OpenJRE 8 " の何れもインストールされていない場合はこれをインストールします。
因みに、JDK (Java Development Kit)は開発環境込みのもので、JRE (Java Runtime Enviroment)はプログラムの実行のみ可能なものです。

->->
[後日追記]
YaCy ver. 1.90はその後修正され、 " Java 7 " でも動作するようになっております。
<-<-

私はUbuntu PCを利用しておりますので、Oracle Java互換の " OpenJRE 8 " を使用させて頂いております。

Ubuntu 14.04 LTSのメイン リポジトリーは " OpenJRE 7 " までの対応で、 " OpenJRE 8 " はUbuntu 14.10以降でメイン リポジトリーに登録されております。

Ubuntu 14.04で " OpenJRE 8 " をインストールするにはPPAを利用致します。インストールは次の様に行います。

まず、ラウンチャーの " コンピューターとオンラインリソースを検索 " のアプリケーション一覧から " 端末 " を選択するか、或いは " Ctrl + Alt + T " を押して " 端末 " を開きます。
そして次のコマンドを入力致します。
sudo add-apt-repository ppa:openjdk-r/ppa
sudo apt-get update
sudo apt-get install openjdk-8-jre

管理者パスワードを入力して " Enter キー " を押すとインストールが始まります。
途中で " Do you want to continue? [Y/n] " と出たら、インストールを続けたい場合は " y " と入力して " Enter キー " を押すとインストールが続行されます。もしも中止したい場合は " n " と入力して " Enter キー " を押して下さい。
インストールが終わったら、次のコマンドでOpenJRE 8が正しくインストールされた事を確認します。
java -version


また、Ubuntu 14.04にて古いヴァージョンの " OpenJRE 7 " が既にインストールしてあり、 " OpenJRE 7 " が不要な場合は削除して下さい。
古いヴァージョンも使い続けたい場合は、 " OpenJRE 8 " をインストールした後で、 " 端末 " で次のコマンドを入力して使用するヴァージョンを切り替えて下さい。
sudo update-alternatives --config java

利用可能なヴァージョンが表示されるので、使用したいヴァージョンの番号を入力して " Enter " キーを押します。

参照させて頂いたウェブサイト:
"CUBE SUGAR STORAGE" の記事 "Ubuntu で使用する Java のバージョンを切り替える" のURL:
http://momijiame.tumblr.com/post/70771860020/ubuntu-で使用する-java-のバージョンを切り替える

情報を参照させて頂いた事に心より感謝致しております。

YaCyを利用する事で、国家や企業によるインターネットの検閲、不正、不当なフィルタリングを防ぐ事が可能です。
但し、通信自体を匿名化するものではございませんので、その目的の為には他のシステムを組み合わせる必要がございます。

以下は暫く前のヴァージョンのYaCyのスクリーンショット画像です。
YaCy_SS_(2015_06_25)_1_Edited_1 分散型インターネット検索エンジン "YaCy" のスクリーンショット画像。検索結果の一覧が表示されている。
https://c1.staticflickr.com/1/751/22190971565_8a57afc081_o.png

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

YaCyの導入の仕方やアップデートの仕方等につきましては以前の私の記事を御覧下さい。

[ブログ記事]
分散型検索エンジン "YaCy" が正式に日本語化されました。
http://crater.blog.so-net.ne.jp/2016-02-25

検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06


" YaCy " の開発用GitHub ページのURL:
https://github.com/yacy/yacy_search_server

膨大な数のインデックス。 [P2P検索エンジン YaCy]

私はP2P通信技術を用いた分散型ウェブ検索エンジンの " YaCy " (ヤスィー)を使い始めてから1年7か月を超えております。
現在、私のPCが保有する、索引付けが済んだドキュメント数は25,000,000を超えております。
YaCy ネットワークは世界中のピアで構成されており、全体では数十億ドキュメントの索引が作成され、共有されております。
しかしながら日本、中国、韓国などのアジア地域のユーザーが慢性的に不足しており、日本のドキュメントはほぼ私の端末のピアからしか検索出来ない状況です。
P2P通信は利用者が多い程性能が向上致します。逆に言えば、利用者が少ないと本来の性能を発揮出来ません。
分散型インターネット検索に少しでも関心を持たれた方は、どうぞYaCyをダウンロードして使用してみて下さい。

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

YaCyの導入の仕方やアップデートの仕方等につきましては以前の私の記事を御覧下さい。

[ブログ記事]
分散型検索エンジン "YaCy" が正式に日本語化されました。
http://crater.blog.so-net.ne.jp/2016-02-25

検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06


" YaCy " の開発用GitHub ページのURL:
https://github.com/yacy/yacy_search_server

分散型検索エンジン "YaCy" が正式に日本語化されました。 [P2P検索エンジン YaCy]

検索の為の索引を各自の端末に分散させ、P2P通信技術を用いる事で、検閲される事を防ぐ事が出来るインターネット検索エンジンが " YaCy " (ヤスィー)です。

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

" YaCy " はドイツ発祥で、オープンソースで開発されたものです。
全世界で広く使われている全文検索エンジンの " Solr " が組み込まれております。
また、Windows, Mac, Linux系の端末で使う事が出来ます。
使用するにはJava VMがインストールしてある必要があります。

私は1年以上前から今日までこの検索エンジンを使用させてもらっております。

"YaCy" は多言語に対応しており、日本語での検索も当然そのまま可能です。

しかしながら今までは設定画面等のインターフェースは、英語、ドイツ語、フランス語、中国語、ロシア語、ウクライナ語、ヒンディー語に対応しておりますが日本語には対応しておりませんでした。

そこで私はYaCyに添付されている翻訳ファイルを使ってインターフェースの日本語翻訳を試みました。

YaCy_SS_(2016_02_15)_1_Edited_1 分散型インターネット検索エンジンの "YaCy" の管理画面のスクリーンショット画像。日本語表示されている。
https://c2.staticflickr.com/2/1450/25041322776_bc871ed287_o.png

翻訳はまだ不完全ですが、私はこれを開発用のソースコード管理サーヴィスの " GitHub " にて " Pull Request " 致しまして、昨日、開発者の方がそれを正式に " YaCy " の最新の開発版アップデートに統合して下さいました。

YaCyを最新開発版にアップデートした後、YaCyの " Administration " 画面の左のコラムの " First Steps " の " Use Case & Account " をクリックして、 " Select a language for the interface: " で " 日本語 " を選択して下さい。直ぐに日本語表示される筈です。
但し、まだ翻訳は不完全ですので、日本語化されるのは一部のメニューのみである事を御了承下さい。


YaCyの導入の仕方やアップデートの仕方等につきましては以前の私の記事を御覧下さい。

[ブログ記事]
検索エンジン "YaCy" は実用性充分です。
http://crater.blog.so-net.ne.jp/2015-10-15

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06


" YaCy " の開発用GitHub ページのURL:
https://github.com/yacy/yacy_search_server

検索エンジン "YaCy" は実用性充分です。 [P2P検索エンジン YaCy]

P2P通信技術を用いた分散型ウェブ検索エンジンの " YaCy " (ヤスィー)を私は毎日利用しております。
開発者の方々の努力のお陰で日々改良が続き、2015年10月15日現在のYaCy ヴァージョンは、 " 1.83/9392 " となっております。

検索の速度も非常に高速になり、一瞬で数万から数十万個の検索結果が得られます。
日本語の検索結果はほとんどが私のPC内のデータベース頼りですので、使い始めてから暫くの間は充分ではないかもしれませんが、日本語の利用者が幾人か増えてくれれば圧倒的に改善する筈です。
結果のランキングの精度はGoogleよりも少し劣りますが、常用できる水準です。

現在、私のUbuntu PCには索引が作られたドキュメントが23,100,000を超える数ございます。
そして逆引き索引(RWI / Reverse Word Index)の索引数は約29,180,000 ワードにもなっております。
これはかなり大きな数だと思います。
どうぞ皆様、この索引の共有に御協力下さい。


YaCy ユーザーは " DHT " (Distributed Hash Table / 分散ハッシュ テーブル)を受け取る設定にしておくと、他のユーザーが作成したウェブの索引を少しづつ自動的に自分の端末のデータベースに統合してくれます。
すると他のユーザーがオフラインになった時にもその人の分の索引が利用できる訳です。
尚、自分の端末では検索されず、他の端末から検索の要求がある索引データはその端末へ送信されて自分の端末からは削除される事もあるようです。

設定の仕方は次の通りです。
YaCy_SS_(2015_10_15)_1_Edited_1 P2P ウェブ検索エンジン "YaCy" の管理画面のスクリーンショット画像。
https://c2.staticflickr.com/6/5690/22190970465_4806c5f165_o.png
管理画面の左のコラムの " First Steps " の " Use Case & Accounts " を選択して、 " Network Configuration " を選択し、 " Distributed Computing Network for Domain " の項目のラジオ ボタンで " Peer-to-Peer Mode " を選択します。

そして " Index Distribution " と " Index Receive " のチェック ボックスにチェック マークを入れます。

そして " SAVE " ボタンを押します。

以上で設定は完了です。



私は更にウェブグラフに基づいた索引を利用する設定にしております。
これの設定の仕方は次の通りです。

管理画面の左のコラムの " Administration " の " Index Administration " を選択して、 " Index Sources & Targets " を選択し、 " Web Structure Index " の項目の " use webgraph search index (rich information in second Solr core) " のチェック ボックスにチェック マークを入れます。

これでウェブグラフに基づく情報が利用出来ます。


私は他にも、検索結果のランキングの重み付けを変えて精度を上げる為に、管理画面の左のコラムの " Search Portal Integration " の " Ranking and Heuristics " を選択して、 " Solr Ranking Configuration " の " Solr Boosts " の値や " RWI Ranking Configuration " の " Pre-Ranking " の値を調整してあります。

"YaCy" の公式ウェブサイトのURL:
http://yacy.net/en/index.html

尚、" YaCy " について、詳しくは次に示す私のブログ記事を読んでいただきたく思います。

[ブログ記事]

分散型検索エンジン YaCy の導入解説
http://crater.blog.so-net.ne.jp/2015-07-21

分散型検索エンジン YaCy のアップデート
http://crater.blog.so-net.ne.jp/2015-06-25

分散型検索エンジンYaCyについての解説動画
http://crater.blog.so-net.ne.jp/2015-03-22

Ubuntu PCでYaCy検索エンジンの為のポート開放の設定
http://crater.blog.so-net.ne.jp/2014-11-06

前の8件 | - P2P検索エンジン YaCy ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。