Apache Lucene


Apache_Lucene

 「ApacheLucene」  
ApacheのLuceneにはある自由とオープンソースの 検索エンジンの ソフトウェアライブラリもともとで書かれ、Javaのでダグ・カッティング。それはによってサポートされているApache Software Foundationのとの下でリリースされたのApacheソフトウェアライセンス。Luceneは、研究以外の検索アプリケーションの標準的な基盤として広く使用されています。 Lucene 開発者
Apache Software Foundation
初回リリース
1999 ; 22年前 (1999)
安定リリース
8.9.0 / 2021年6月16日 ; 3か月前  (2021-06-16)
リポジトリ
github .com / apache / lucene
で書かれている Java オペレーティング・システム
クロスプラットフォーム
タイプ
検索とインデックス作成
ライセンス
Apacheライセンス2.0
Webサイト
luceneの.apache .ORG
Luceneは、Object Pascal、Perl、C#、C ++、Python、Ruby、PHPなどの他のプログラミング言語に移植されています。

コンテンツ
1 歴史
2 機能と一般的な使用
3 Luceneベースのプロジェクト
4 も参照してください
5 参考文献
6 参考文献
7 外部リンク

歴史
ダグ・カッティングはもともと1999年にLuceneを作成しました。 Luceneは彼の5番目の検索エンジンであり、以前はXerox PARCで2つ、Appleで1つ、Exciteで4つを作成していました。当初は、SourceForgeWebサイトの自宅からダウンロードできました。2001年9月にApacheSoftware FoundationのオープンソースJava製品のJakartaファミリーに加わり、2005年2月に独自のトップレベルのApacheプロジェクトになりました。Luceneという名前は、ダグカッティングの妻のミドルネームと母親の祖母のファーストネームです。
Luceneには、以前はLucene.NET、Mahout、Tika、Nutchなどの多くのサブプロジェクトが含まれていました。これら3つは、現在、独立したトップレベルのプロジェクトです。
2010年3月、Apache Solr検索サーバーがLuceneサブプロジェクトとして参加し、開発者コミュニティを統合しました。
バージョン4.0は2012年10月12日にリリースされました。
2021年3月には、Luceneには、そのロゴを変更し、ApacheのSolrのは、 Luceneとは独立し、再びトップレベルのApacheプロジェクトとなりました。

機能と一般的な使用
Luceneは、全文索引付けおよび検索機能を必要とするすべてのアプリケーションに適していますが、インターネット検索エンジンおよびローカルの単一サイト検索の実装におけるその有用性が認められています。
Luceneには、編集距離に基づいてあいまい検索を実行する機能が含まれています。
Luceneは、レコメンデーションシステムの実装にも使用されています。たとえば、Luceneの「MoreLikeThis」クラスは、同様のドキュメントの推奨事項を生成できます。「MoreLikeThis」の用語ベクトルベースの類似性アプローチと、共引用や共引用近接分析などの引用ベースのドキュメント類似性測定との比較では、Luceneのアプローチは、非常に類似した構造特性とより狭い関連性を持つドキュメントの推奨に優れていました。 。対照的に、引用ベースの文書の類似度がより広く関連文書を推薦するためのより適切である傾向があった、引用ベースのアプローチを意味生成するために、より適切であり得る偶然限り推奨される文書がで含むように、勧告を-テキストの引用。

Luceneベースのプロジェクト
Lucene自体は単なるインデックス作成および検索ライブラリであり、クロールおよびHTML解析機能は含まれただし、いくつかのプロジェクトがLuceneの機能を拡張しています。
Apache Nutch –WebクロールとHTML解析を提供します
Apache Solr –エンタープライズ検索サーバー
コンパス– Elasticsearch の前身
CrateDB –Lucene上に構築されたオープンソースの分散SQLデータベース
DocFetcher –マルチプラットフォームデスクトップ検索アプリケーション
Elasticsearch – 2010年にリリースされたエンタープライズ検索サーバー
Kinosearch -で書かれた検索エンジンのPerlとC とルーズポートのLuceneの。 Socialtextのウィキのソフトウェアは、この検索エンジンを使用してとそうMojoMojoのWikiは。これは、ヒューマンメタボロームデータベース(HMDB)および毒素および毒素標的データベース(T3DB)でも使用されます。
MongoDB Atlas Search –MongoDBとApacheLuceneに基づくクラウドネイティブのエンタープライズ検索アプリケーション
OpenSearch – Elasticsearch7のフォークに基づくオープンソースのエンタープライズ検索サーバー
Swiftype –Luceneをベースにしたエンタープライズ検索のスタートアップ

も参照してください
image"
 無料のオープンソースソフトウェアポータル
エンタープライズサーチ
情報抽出
情報検索ライブラリー一覧
テキストマイニング

参考文献
^ 「ApacheLuceneへようこそ」。Lucene™ニュースセクション。
^ カンフィス、クリス; de Vries、Arjen P。; ボイトソフ、レオニード; Lin、Jimmy(2020)、Jose、Joemon M。; イルマズ、エミネ; Magalhães、João; Castells、Pablo(eds。)、「どのBM25を意味しますか?スコアリングバリアントの大規模な再現性研究」、情報検索の進歩、Cham:Springer International Publishing、12036:28–34、doi:10.1007 / 978-3 -030-45442-5_4、ISBN  978-3-030-45441-8、PMC  7148026は、取得した2021年6月7日に ^ グランド、エイドリアン; ミュア、ロバート; フェレンツィ、ジム; Lin、Jimmy(2020)、Jose、Joemon M。; イルマズ、エミネ; Magalhães、João; Castells、Pablo(eds。)、””From MAXSCORE to Block-Max Wand:The Story of How Lucene Significantly Improvement Query Evaluation Performance””、Advances in Information Retrieval、Cham:Springer International Publishing、12036:20–27、doi:10.1007 / 978-3-030-45442-5_3、ISBN  978-3-030-45441-8、PMC  7148045は、取得した2021年6月7日に ^ アッツォパルディ、リーフ; Moshfeghi、Yashar; マーティン・ハルヴィー; Alkhawaldeh、Rami S。; バログ、クリスチャン; ディ・ブッチョ、エマヌエーレ; セッカレッリ、ディエゴ; フェルナンデス-ルナ、フアンM。; ハル、チャーリー; マニックス、ジェイク; Palchowdhury、Sauparna(2017-02-14)。「Lucene4IR:Luceneを使用した情報検索評価リソースの開発」。ACMSIGIRフォーラム。50(2):58–75。土井:10.1145 /3053408.3053421。ISSN 0163から5840まで。   ^ 「LuceneImplementations」。apache.org。
^ KeywordAnalyzer「 ApacheLucene
とSolrによるより良い検索」(PDF)。2012年1月31日のオリジナル(PDF)からアーカイブ。
^ カッティング、ダグ(2019-06-07)。「XeroxPARCでいくつかの検索エンジンを作成し、次にAppleでV-Twinを作成し、次にExciteの検索を書き直し、次にLuceneを作成しました。したがって、LuceneはV-Twin 3.0と見なされる可能性がありますか?ほぼ25年後、V-Twinはまだ存続しています。 Mac OS X検索キットとしてオンに!」。@cutting 。
^ バーカー、ディーン(2016)。Webコンテンツ管理。オライリー。NS。233. ISBN  978-1491908105。
^ 「ApacheLucene-ApacheLuceneへようこそ」。apache.org。取り出される4年2月2016。
^ McCandless、Michael; ハッチャー、エリック; Gospodnetić、Otis(2010)。Lucene in Action、第2版。マニング。NS。 8。ISBN  978-1933988177。
^ 「GNU / Linuxセマンティックストレージシステム」(PDF)。glscube.org。2010年6月1日にオリジナル(PDF)からアーカイブされました。
^ 「ApacheLucene-クエリパーサー構文」。lucene.apache.org。
^ J. Beel、S。Langer、およびB. Gipp、「Docearの研究論文レコメンダーシステムのアーキテクチャとデータセット」、第3回国際鉱業科学出版物ワークショップ(WOSP 2014)のACM / IEEE合同会議の議事録デジタルライブラリ(JCDL 2014)、ロンドン、英国、2014年 ^ M. Schwarzer、M。Schubotz、N。Meuschke、C。Breitinger、V。Markl、およびB. Gipp、https: //www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016 。 pdf「のリンクベースの推奨事項の評価」、第16回ACM / IEEE-CSデジタルライブラリに関する合同会議(JCDL)、ニューヨーク、ニューヨーク、米国、2016年、191〜200ページ。
^ 「コンパスとElasticsearchの未来」。男は従います。
^ ウェイナー、ピーター。「今すぐ調べる価値のある11の最先端データベース」。InfoWorld。
^ 「Elasticsearch:RESTful、分散検索および分析-Elastic」。elastic.co。
^ Natividad、アンジェラ。「SocialtextUpdatesSearch、GoesKino」。CMSワイヤー。
^ マーヴィンハンフリー。「KinoSearch-検索エンジンライブラリ。-metacpan.org」。p3rl.org 。
^ Diment、Kieren; トラウト、マットS(2009)。「CatalystCookbook」。Catalystの決定的なガイド。押してNS。 280。ISBN  978-1-4302-2365-8。
^ ウィシャート、DS; etal。。「HMDB:人間のメタボロームのための知識ベース」。核酸解像度。37(データベースの問題):D603–10。土井:10.1093 / nar / gkn810。PMC 2686599。PMID 18953024。
   ^ リム、エミリア; ポン、アリソン; ジュンボウ、ヤニック; ノックス、クレイグ; Shrivastava、Savita; 郭、安智; Neveu、Vanessa; Wishart、David S.。「T3DB:一般的な毒素とその標的の包括的に注釈が付けられたデータベース」。核酸解像度。38(データベースの問題):D781–6。土井:10.1093 / nar / gkp934。PMC 2808899。PMID 19897546。   

参考文献
Gospodnetic、Otis; エリックハッチャー; Michael McCandlessLucene in Action(第2版)。マニング出版物。ISBN 978-1-9339-8817-7。
Gospodnetic、Otis; エリックハッチャーLucene in Action(第1版)。マニング出版物。ISBN 978-1-9323-9428-3。

外部リンク
公式サイト