Sudachi

Sudachi

ビジネス向け日本語形態素解析器 - Elasticsearch対応

無料無料・オープンソース(Apache 2.0)

プロダクト詳細

Sudachi とは

Works Applications が開発した、ビジネス用途に最適化された日本語形態素解析器です。

主な機能

  • 3段階の分割モード: A(短い)/ B(中間)/ C(長い)
  • 複数辞書エディション: small / core / full
  • 正規化機能: 異体字・送り仮名の統一
  • Elasticsearch プラグイン: 全文検索に統合
  • Python版 SudachiPy: Python環境で利用可能

特徴

  • UniDic + NEologd を元にした大規模辞書
  • 新語・固有名詞に強い
  • 商用利用可能

対象ユーザー

  • 自然言語処理エンジニア
  • 検索システム開発者
  • テキストマイニング

提供企業

dsuke

dsuke

RAG開発ツールの情報を整理・発信しています

お問い合わせ

Sudachi」について詳しく知りたい方はお問い合わせください。