Select Language

Open Dataset

多言語

多言語

0.23M
657 hits
0 likes
0 downloads
0 discuss
Software,NLP,Deep Learning Classification

Data Structure ? 0.23M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    # stopwords-json [![Build Status](https://travis-ci.org/6/stopwords-json.svg?branch=travis)](https://travis-ci.org/6/stopwords-json) [![npm](https://img.shields.io/npm/v/stopwords-json.svg?maxAge=3600)](https://www.npmjs.com/package/stopwords-json) [![Bower](https://img.shields.io/bower/v/stopwords-json.svg?maxAge=3600)](https://bower.io/) JSON形式の様々な言語のストップワード。[ウィキペディア](http://en.wikipedia.org/wiki/Stop_words)によると: > ストップワードは、自然言語データの処理の前または後にフィルタリングされる単語です [...] これらは、*the*、*is*、*at*、*which*、*on* などの最も一般的な短い機能語の一部です。 [stopwords-all.json](stopwords-all.json)(言語のISO 639-1コードでキー付けされている)を使用してすべてのストップワードを利用できます。または、個々の言語のストップワードファイルについては以下の表を参照してください。 ## 言語 合計50の言語がサポートされています: 言語 | ストップワード数 | ファイル名 --- | --- | --- アフリカーンス語 | 51 | [af.json](dist/af.json) アラビア語 | 162 | [ar.json](dist/ar.json) アルメニア語 | 45 | [hy.json](dist/hy.json) バスク語 | 98 | [eu.json](dist/eu.json) ベンガル語 | 116 | [bn.json](dist/bn.json) ブルトン語 | 126 | [br.json](dist/br.json) ブルガリア語 | 259 | [bg.json](dist/bg.json) カタルーニャ語 | 218 | [ca.json](dist/ca.json) 中国語 | 542 | [zh.json](dist/zh.json) クロアチア語 | 179 | [hr.json](dist/hr.json) チェコ語 | 346 | [cs.json](dist/cs.json) デンマーク語 | 101 | [da.json](dist/da.json) オランダ語 | 275 | [nl.json](dist/nl.json) 英語 | 570 | [en.json](dist/en.json) エスペラント語 | 173 | [eo.json](dist/eo.json) エストニア語 | 35 | [et.json](dist/et.json) フィンランド語 | 772 | [fi.json](dist/fi.json) フランス語 | 606 | [fr.json](dist/fr.json) ガリシア語 | 160 | [gl.json](dist/gl.json) ドイツ語 | 596 | [de.json](dist/de.json) ギリシャ語 | 75 | [el.json](dist/el.json) ハウサ語 | 39 | [ha.json](dist/ha.json) ヘブライ語 | 194 | [he.json](dist/he.json) ヒンディー語 | 225 | [hi.json](dist/hi.json) ハンガリー語 | 781 | [hu.json](dist/hu.json) インドネシア語 | 355 | [id.json](dist/id.json) アイルランド語 | 109 | [ga.json](dist/ga.json) イタリア語 | 619 | [it.json](dist/it.json) 日本語 | 109 | [ja.json](dist/ja.json) 韓国語 | 679 | [ko.json](dist/ko.json) ラテン語 | 49 | [la.json](dist/la.json) ラトビア語 | 161 | [lv.json](dist/lv.json) マラーティー語 | 99 | [mr.json](dist/mr.json) ノルウェー語 | 172 | [no.json](dist/no.json) ペルシャ語 | 332 | [fa.json](dist/fa.json) ポーランド語 | 260 | [pl.json](dist/pl.json) ポルトガル語 | 408 | [pt.json](dist/pt.json) ルーマニア語 | 282 | [ro.json](dist/ro.json) ロシア語 | 539 | [ru.json](dist/ru.json) スロバキア語 | 110 | [sk.json](dist/sk.json) スロベニア語 | 446 | [sl.json](dist/sl.json) ソマリ語 | 30 | [so.json](dist/so.json) 南ソト語 | 31 | [st.json](dist/st.json) スペイン語 | 577 | [es.json](dist/es.json) スワヒリ語 | 74 | [sw.json](dist/sw.json) スウェーデン語 | 401 | [sv.json](dist/sv.json) タイ語 | 115 | [th.json](dist/th.json) トルコ語 | 279 | [tr.json](dist/tr.json) ヨルバ語 | 60 | [yo.json](dist/yo.json) ズールー語 | 29 | [zu.json](dist/zu.json) ## 出典 - [Apache Lucene](http://lucene.apache.org/) - [Apache 2.0 License](http://www.apache.org/licenses/LICENSE-2.0) - [Carrot2](https://github.com/carrot2/carrot2) - [License](http://project.carrot2.org/license.html) - [cue.language](https://github.com/vcl/cue.language) - [Apache 2.0 License](https://github.com/vcl/cue.language/blob/master/license.txt) - [Jacques Savoy](http://members.unine.ch/jacques.savoy/clef/index.html) - BSD License - SMART情報検索システム: ftp://ftp.cs.cornell.edu/pub/smart/ - [ASP Stoplist Project](https://github.com/dohliam/more-stoplists) - CC-BYおよびApache 2.0 ## ライセンスと著作権 Copyright (c) 2017 Peter Graham、貢献者。 Apache-2.0ライセンスの下で公開されています。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 657
    • 0
    • 0
    • collect
    • Share