top of page
作家相片James Ramos

快速認識AI關鍵詞系列-1

已更新:2023年5月22日



快速認識AI關鍵詞系列(1-30)



1. 人工智慧 (Artificial Intelligence, AI):透過模擬人類智慧的能力,讓機器能夠自主地進行學習和決策。AI技術包括機器學習、深度學習、自然語言處理、計算機視覺等,它們的目標都是讓機器具有類似人類的智慧,並且能夠對現實世界做出反應。


2. 機器學習 (Machine Learning, ML):透過演算法和統計學方法,讓機器從數據中學習和改進,並且自動提高準確率。機器學習可以分為監督學習、非監督學習和半監督學習等不同的類型,它們的目標都是使機器具有自我學習的能力,從而更好地應對現實世界的問題。


3. 深度學習 (Deep Learning, DL):一種基於神經網絡的機器學習方法,可以對複雜的圖像、語音和自然語言進行識別和生成。深度學習是一種特殊的機器學習方法,它使用多層神經網絡進行學習,可以處理大量的數據和複雜的問題,已經在許多領域中取得了顯著的成果。


4. 監督學習 (Supervised Learning):一種機器學習方法,通過標註的數據集來訓練機器學習演算法,使其可以對新數據進行準確的預測。監督學習主要用於分類和回歸問題,其中分類問題是將數據劃分為不同的類別,回歸問題是預測數據的連續值。



5. 非監督學習 (Unsupervised Learning):一種機器學習方法,通過未標註的數據集來訓練機器學習演算法,使其可以從中發現數據中的模式和結構。非監督學習主要用於聚類和降維問題,其中聚類是將相似的數據劃分為一組,降維是減少數據的維度,以更好地理解數據中的結構。


6. 半監督學習 (Semi-Supervised Learning):一種機器學習方法,通過部分標註的數據集來訓練機器學習演算法,以提高其對未標註數據的準確預測能力。半監督學習結合了監督學習和非監督學習的優點,能夠更好地處理現實世界中存在的大量未標註數據的問題。


7. 強化學習 (Reinforcement Learning):一種機器學習方法,通過對系統的反饋來訓練機器學習演算法,以最大化獎勵,從而達到特定目標。強化學習主要應用於訓練智慧代理,如自主駕駛汽車和機器人等,從而使它們能夠自主地控制行動。

8. 分類 (Classification):一種機器學習技術,通過將數據劃分為不同的類別,使機器可以對新數據進行預測。分類是一種監督學習方法,常用於圖像識別、語音識別和自然語言處理等領域。


9. 回歸 (Regression):一種機器學習技術,通過建立一個函數,可以將數據映射到一個連續的數值空間中,以預測未知數值。回歸也是一種監督學習方法,通常用於預測數值型的結果,如房價預測和股票價格預測等。


10. 聚類 (Clustering):一種機器學習技術,通過將相似的數據劃分為一組,以便更好地理解數據中的結構。聚類是一種非監督學習方法,通常用於探索性數據分析、市場分割和網路分析等領域,可以幫助發現數據中的潛在模式和群體。


11. 支持向量機(Support Vector Machine,SVM):一種基於監督學習的機器學習方法,用於二元分類和回歸分析。SVM的核心思想是在高維空間中找到一個超平面,以最大化不同類別之間的邊際距離,從而實現分類。SVM通常適用於數據集較小的情況下,且適用於非線性的分類問題。


12. 決策樹(Decision Tree):一種監督學習的機器學習方法,通過將數據分解成不同的分支和決策來預測結果。決策樹通常用於分類和回歸問題,以及特徵選擇。決策樹的優點在於易於理解和解釋,但其容易產生過度擬合和不穩定的問題。


13. 隨機森林(Random Forest):一種基於決策樹的監督學習機器學習方法,通過構建多個決策樹來改進準確率。隨機森林是一種集成學習方法,它可以有效地處理過度擬合問題,並能處理高維數據集。


14. 梯度提升(Gradient Boosting):一種基於決策樹的監督學習機器學習方法,通過連續構建新決策樹來改進準確率。梯度提升可以有效地處理高維數據集,並且可以用於回歸和分類問題。


15. 神經網絡(Neural Network):一種基於人類神經系統的機器學習方法,可以通過學習來對複雜的模式進行識別和生成。神經網絡由多個相互連接的神經元組成,並且可以透過調整權重和偏差值進行學習。神經網絡通常用於圖像識別、語音識別、自然語言處理和控制問題等。


16. 卷積神經網絡(Convolutional Neural Network,CNN):一種應用於圖像和視頻識別的神經網絡方法,通過利用卷積操作捕捉圖像中的空間關係。CNN通常包括卷積層、池化層、全連接層等模塊,並且其具有對平移、旋轉和縮放不變性等特點,因此常用於圖像分類和目標檢測等。


17. 遞歸神經網絡(Recurrent Neural Network,RNN):一種應用於自然語言處理和時間序列分析的神經網絡方法,可以捕捉序列中的時間依賴關係。RNN通常包括多個時刻的循環神經元,並且可以通過調整權重和偏差值進行學習。RNN通常用於語言建模、文本生成和語音識別等。


18. 自動編碼器(Autoencoder):一種無監督學習的神經網絡方法,可以從輸入數據中學習一個低維度表示,以便更好地理解數據結構。自動編碼器由編碼器和解碼器組成,並且可以通過最小化重構誤差來進行學習。自動編碼器通常用於數據壓縮、降維和特徵提取等。


19. 生成對抗網絡(Generative Adversarial Network,GAN):一種基於神經網絡的無監督學習方法,用於生成以假亂真的數據。GAN由生成器和判別器組成,並且可以通過最小化生成數據和真實數據之間的差距來進行學習。GAN通常用於圖像生成、音頻生成和文本生成等。


20. 正則化(Regularization):一種防止機器學習演算法過擬合的方法,通常通過限制模型複雜度或添加懲罰項來實現。正則化可以提高模型的泛化能力,避免過擬合現象,進而提高模型的性能。常見的正則化方法包括L1正則化、L2正則化和dropout等,其中L1正則化通常會使模型的權重稀疏化,而L2正則化則會使模型的權重分佈更加平滑。dropout可以在訓練過程中隨機丟棄一部分神經元,以減少模型的過擬合現象。


21. 梯度下降(Gradient Descent):是一種優化演算法,用於調整機器學習模型的參數,以最小化損失函數。梯度下降演算法通過計算損失函數關於參數的導數,然後按照導數的反方向更新參數,從而使損失函數下降到最小值。梯度下降演算法分為批量梯度下降、隨機梯度下降和小批量梯度下降三種。


22. 學習率(Learning Rate):是梯度下降演算法中控制每次參數更新的步長,它決定了模型的性能和收斂速度。學習率過小會導致模型收斂速度慢,而學習率過大會導致模型無法收斂。


23. 超參數(Hyperparameter):是機器學習演算法中需要手動調整的參數,例如學習率、正則化參數等。超參數的選擇對模型的性能和泛化能力有很大的影響。


24. 交叉驗證(Cross-Validation):是一種測試機器學習模型泛化能力的方法,通常通過將資料集分成多個子集來實現。交叉驗證可以評估模型的性能,防止模型對訓練資料過擬合。


25. 雜訊(Noise):是指資料集中不想要的或不規則的資訊,可能會影響機器學習演算法的性能。雜訊可能來自資料獲取過程中的誤差或者資料本身的不完整性。


26. 損失函數(Loss Function):是機器學習演算法中用於評估預測結果和實際結果之間的差異的函數。損失函數的選擇取決於模型的任務類型,例如回歸任務常用均方誤差損失函數,分類任務常用交叉熵損失函數。



27.  正負樣本(Positive and Negative Samples):在監督學習中,正樣本是指屬於某一類別的數據,負樣本是指不屬於該類別的數據。這些樣本是用來訓練和評估監督學習模型的重要組成部分。在二元分類任務中,通常將正樣本標記為1,負樣本標記為0。


28.  混淆矩陣(Confusion Matrix):是用於評估二元分類模型性能的矩陣,通常由四個值組成:真陽性(True Positive,TP)、假陽性(False Positive,FP)、真陰性(True Negative,TN)、假陰性(False Negative,FN)。通過比較預測值和實際值的交叉情況,可以計算出許多指標,如準確率、召回率、精確率等。


29.  ROC曲線(ROC Curve):是一種用於評估二元分類模型性能的曲線,ROC全稱是“接收者操作特徵曲線”(Receiver Operating Characteristic Curve)。ROC曲線以真陽性率(True Positive Rate,TPR)為Y軸,以假陽性率(False Positive Rate,FPR)為X軸繪製。ROC曲線下的面積即AUC(Area Under the Curve),是評估二元分類模型性能的重要指標之一。


30.  AUC(Area Under the Curve):是ROC曲線下的面積,用於評估二元分類模型的性能。AUC的取值範圍在0到1之間,通常越接近1,代表模型的性能越好。AUC的計算可以通過積分或是泰森多邊形(Trapezoidal)法等方法進行。AUC是許多機器學習演算法中常用的評估指標之一。


機器學習和人工智慧已經在各個領域和行業中得到廣泛應用,這樣的技術可以應用於生成各種形式的數據,如圖像、文本、語音等,為許多領域帶來了巨大的影響和改變,我們需要不斷地學習和創新,探索新的應用領域和方法,以更好地應對現實世界的問題和挑戰。


Lin Hui-Ting編譯

bottom of page