對齊研究中心 - 维基百科,自由的百科全书

Alignment Research Center
成立時間2021年4月 (2021-04)
創始人保羅·克里斯蒂亞諾英语Paul Christiano (researcher)
貝絲·巴恩斯(Beth Barnes)
Mark Xu
總部 美国加利福尼亞州柏克萊
目標人工智慧對齊安全性研究英语AI safety

對齊研究中心(英語:Alignment Research Center, ARC)是美國的非營利研究機構,致力將人工智慧的行為對齊人類的價值觀和預期利益。[1]對齊研究中心由美國人工智慧研究實驗室OpenAI前研究員保羅·克里斯蒂亞諾英语Paul Christiano (researcher)創立,專注於識別和理解AI模型的潛在危害。[2][3]



對齊研究中心的使命是確保未來的機器學習系統能夠安全地設計和開發,並造福人類。研究中心由保羅·克里斯蒂亞諾英语Paul Christiano (researcher)和其他研究人員於2021年4月創立,主要研究對人工智慧對齊相關理論的挑戰[4],理論的一關鍵在於當人工智慧系統變得愈加先進時,其設計者人類開發的對齊技術可能因此被規避或發現漏洞。[5]對齊研究中心亦嘗試從理論工作提升至實證研究、相關產業的合作和政策制定。[6][7]

2022年3月,對齊研究中心自開放慈善計畫英语Open Philanthropy獲得26.5 萬美元。[8]同年,加密貨幣交易平台FTX宣布破產,對齊研究中心表示將歸還其創始人山姆·班克曼-弗里德的FTX基金會(FTX Foundation)所提供的125萬美元捐款。[9]



  1. ^ MacAskill, William. How Future Generations Will Remember Us. The Atlantic. 2022-08-16 [2023-04-23]. (原始内容存档于2023-06-08) (英语). 
  2. ^ Klein, Ezra. This Changes Everything需要付费订阅. The New York Times. 2023-03-12 [2023-04-30]. ISSN 0362-4331. (原始内容存档于2023-08-05) (美国英语). 
  3. ^ Piper, Kelsey. How to test what an AI model can — and shouldn't — do. Vox. 2023-03-29 [2023-04-30]. (原始内容存档于2023-06-01) (英语). 
  4. ^ Christiano, Paul. Announcing the Alignment Research Center. Medium. 2021-04-26 [2023-04-16]. (原始内容存档于2023-08-07) (英语). 
  5. ^ Christiano, Paul; Cotra, Ajeya; Xu, Mark. Eliciting Latent Knowledge: How to tell if your eyes deceive you. Google Docs. Alignment Research Center. 2021-12 [2023-04-16]. (原始内容存档于2023-04-20) (英语). 
  6. ^ Alignment Research Center. Alignment Research Center. [2023-04-16]. (原始内容存档于2023-07-18) (英语). 
  7. ^ Pandey, Mohit. Stop Questioning OpenAI's Open-Source Policy. Analytics India Magazine. 2023-03-17 [2023-04-23]. (原始内容存档于2023-05-01) (美国英语). 
  8. ^ Alignment Research Center — General Support. Open Philanthropy. 2022-06-14 [2023-04-16]. (原始内容存档于2023-04-20) (美国英语). 
  9. ^ Wallerstein, Eric. FTX Seeks to Recoup Sam Bankman-Fried's Charitable Donations需要付费订阅. Wall Street Journal. 2023-01-07 [2023-04-30]. ISSN 0099-9660. (原始内容存档于2023-06-28) (美国英语). 
  10. ^ GPT-4 System Card (PDF), OpenAI, 2023-03-23 [2023-04-16], (原始内容存档 (PDF)于2023-04-07) (英语) 
  11. ^ Edwards, Benj. OpenAI checked to see whether GPT-4 could take over the world. Ars Technica. 2023-03-15 [2023-04-30]. (原始内容存档于2023-04-05) (美国英语). 
  12. ^ Update on ARC's recent eval efforts: More information about ARC's evaluations of GPT-4 and Claude. Alignment Research Center. 2023-03-17 [2023-04-16]. (原始内容存档于2023-04-05) (英语). 
  13. ^ Cox, Joseph. GPT-4 Hired Unwitting TaskRabbit Worker By Pretending to Be 'Vision-Impaired' Human. Vice News Motherboard. 2023-03-15 [2023-04-16]. (原始内容存档于2023-04-10) (英语). 
  14. ^ Burke, Cameron. 'Robot' Lawyer DoNotPay Sued For Unlicensed Practice Of Law: It's Giving 'Poor Legal Advice'. Yahoo Finance. 2023-03-20 [2023-04-30]. (原始内容存档于2023-05-04) (美国英语). 

