本課程關(guān)注四個概念: 解釋、公平、隱私和健壯性。

ML模型無處不在——從交通(自動駕駛汽車)到金融(信用卡或抵押貸款申請)和職業(yè)(公司招聘)。然而,ML并非沒有風(fēng)險。一些重要的風(fēng)險涉及模型理解和問責(zé):機(jī)器學(xué)習(xí)創(chuàng)建的模型很大程度上是我們難以窺視和理解的黑盒子;他們?nèi)菀资艿讲豢深A(yù)見的錯誤、對抗性操縱以及在隱私和公平方面違反倫理規(guī)范的影響。本課程將提供最先進(jìn)的ML方法的介紹,旨在使人工智能更值得信賴。本課程關(guān)注四個概念: 解釋、公平、隱私和健壯性。我們首先討論如何解釋ML模型輸出和內(nèi)部工作。然后,我們研究了偏差和不公平是如何在ML模型中產(chǎn)生的,并學(xué)習(xí)了緩解這個問題的策略。接下來,我們將研究模型在不應(yīng)該泄漏敏感信息的情況下泄漏敏感信息的上下文中的差異隱私和成員關(guān)系推斷。最后,我們將討論對抗性攻擊和提供抗對抗性操作的健壯性的方法。學(xué)生將了解一套方法和工具,以部署透明、倫理和魯棒的機(jī)器學(xué)習(xí)解決方案。學(xué)生將完成實驗,家庭作業(yè),并討論每周閱讀。
https://web.stanford.edu/class/cs329t/syllabus.html










編輯:文婧