Select Language

Open Dataset

頻度が最も高い9933個の最も常用される漢字データセット

頻度が最も高い9933個の最も常用される漢字データセット

1M
818 hits
0 likes
4 downloads
0 discuss
MNIST Classification

Data Structure ? 1M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    データの収集は、redditのユーザーareydeの簡単な質問から始まりました。その質問は「すべての漢字を学ぶとはどういう意味か?」で、「漢字の学習についてどんな目標を設定できるか?」と言い換えることもできます。

    彼の考えでは、最も有用なものは漢字の出現頻度のようです。そこで、彼はコーパス http://lingua.mtsu.edu/chinese-computing/statistics/char/list.php?Which=MO に基づいて、すべての9,933個の文字をリストアップしました。このデータセットの各漢字には、実際には以下の情報が保存されています。コーパスでの出現回数、そのコーパスに占める計算上の割合、部首と辞書コード、画数、発音、および(存在する場合)意味です。

    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 818
    • 4
    • 0
    • collect
    • Share