Select Language

Open Dataset

乳がんアメリカウィスコンシン州(診断)データセット

乳がんアメリカウィスコンシン州(診断)データセット

49K
1621 hits
0 likes
12 downloads
0 discuss
Medical Classification

癌が良性か悪性かの特徴予測は、乳腺腫瘤の細針吸引(FNA)のデジタル画像から算出されます。それらは画像中に存在する細胞核の特徴を記述しています。3次元......

Data Structure ? 49K

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    癌が良性か悪性かを予測する

    特徴は、乳腺腫瘤の細針吸引(FNA)のデジタル画像から算出されます。それらは、画像に存在する細胞核の特徴を表しています。
    3次元空間で記述される空間は以下の通りです:[KP BennettとOL Mangasarian:「2つの線形分離不能集合のロバストな線形計画判別」、最適化手法とソフトウェア1、1992年、23 - 34頁]。

    属性情報:

    1)ID番号
    2)診断(M =悪性、B =良性)
    3 - 32)

    各細胞核について10個の実数値特徴が計算されます:

    a)半径(中心から外周の点までの距離の平均値)
    b)テクスチャ(グレースケール値の標準偏差)
    c)周囲長
    d)面積
    e)平滑度(半径長の局所的な変化)
    f)緊密度(周囲長^ 2 /面積 - 1.0)
    g)凹度(輪郭の凹部の深刻度)
    h)凹点(輪郭の凹部の数)
    i)対称性
    j)フラクタル次元(「海岸線近似」 - 1)


    各画像について、これらの特徴の平均値、標準誤差、および「最悪」または最大値(3つの最大値の平均)が計算され
    、それによって30個の特徴が得られます。たとえば、フィールド3は平均半径、フィールド13は半径の標準誤差、フィールド23は最悪半径です。

    すべての特徴値は、有効数字4桁で再コードされています。

    欠損属性値:なし

    クラス割り当て:良性357、悪性212

    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:10 Go earn points?
    • 1621
    • 12
    • 0
    • collect
    • Share