建構預測乳癌之KNN鑑別模型
楊偉修 黃敏誠 廖昇飛 張智恆 唐維志 朱宇凡
DOI:10.6283/JOCSG.2015.3.3.327
下載PDF檔 ( 已下載次數:1327)
中文摘要 依據衛生福利部國民健康署公告國人死因統計結果顯示(衛生福利部國民健康署,2014),102年國人因惡性腫瘤死亡人數為44,791人,占總死亡人數之29.0%,而女性乳癌則位居十大癌症死因之第四順位,占所有因癌症死亡人數之16.8%,是目前國人不可忽視的重大疾病之一。然而乳癌的存活率平均達百分之六十,第一期的乳癌存活率約為百分之八十,甚至若能於乳癌零期時即發現,其存活率更可高達百分之百。因此如何有效且準確的區分該疾病,及早發現及時治療,讓所有婦女皆能免於此疾病的威脅,健康且成功的老化,則成為本研究的主要目的。
近年來已有許多的研究,成功的將資料探勘技術應用於醫療領域問題上,而在眾多的資料探勘技術中,k最近鄰演算法(K Nearest Neighbor Algorithm, KNN)是一種最簡單且直覺化的方法。但KNN演算法從發展至今,一直存在兩個問題,一個就是必須儲存大量的訓練樣本,另一個則是無法準確的決定最佳值。為解決上述問題,已經有許多學者提出有效的樣本篩選方法,然對於如何決定最佳 值,至今仍無具體且有效的方法。但是 值的選取,絕對會影響KNN演算法的執行結果,分類過程中如能以真正的最佳 值進行計算,則可以建立高準確率的分類模型。此外,以不同的距離函數計算,亦會產生不同的準確率,因此亦有很多學者發展出各種不同的距離函數以提升KNN演算法的準確率。有鑑於此,本研究預先將資料以四種不同的資料正規化法處理,再分別以常用的歐幾里得距離(Euclidean distance)與曼哈頓距離(Manhattan distance)進行計算,分析每種情況下各種 值的準確率變化情形,以期建立簡易使用且具高準確度的乳癌鑑別模型。
文章建立時間:2015-06-15
引用格式(APA):
楊偉修, 黃敏誠, 廖昇飛, 張智恆, 唐維志, 朱宇凡(2015)。 建構預測乳癌之KNN鑑別模型。
福祉科技與服務管理學刊, 3(3), 327-328。