新版阿爾法圍棋 從零自學稱王

副刊

 日前人工智慧「阿爾法圍棋」在幾次世界矚目的人機大戰後站在了圍棋之巔,現在它又以一種新的方式超越了自己:新版本「從零開始」學習圍棋,僅用3天就擊敗其前輩版本,成為新的王者。
 英國「深度思維」公司開發出了「阿爾法圍棋」,該公司團隊在英國《自然》雜誌上發表題為《在沒有人類知識條件下掌握圍棋遊戲》的論文,介紹了最新版的「阿爾法圍棋-零」。
 該公司將「阿爾法圍棋」的發展分為4個階段:第一個版本是「阿爾法圍棋-樊」,它在2015年戰勝歐洲圍棋冠軍樊麾,標誌著人工智慧首次戰勝人類職業棋手;第二個版本是「阿爾法圍棋-李」,它在2016年戰勝曾多次奪得世界冠軍的韓國棋手李世石,標誌著人工智慧戰勝人類頂級棋手;第三個版本是「阿爾法圍棋-大師」,在今年戰勝現在世界排名第一的柯潔,並在與多位有世界冠軍頭銜的人類棋手「群戰」中完勝。
 但是,這些版本在剛開始學習圍棋時,都要依靠人類知識,即先教它們一些人類摸索出的基本下法,然後再開始自己學習。
 第四個版本,即最新的「阿爾法圍棋-零」擺脫了這個限制,研究人員沒有給它除棋盤和棋子之外的任何輸入,它完全是「從零開始」,自己與自己對弈,通過更為優秀的演算法,取得飛速進步。
 開始學習圍棋3天後,「阿爾法圍棋-零」就以100比0的成績戰勝了「阿爾法圍棋-李」;40天後,它又戰勝了在所有人類高手看來已不可企及的「阿爾法圍棋-大師」。
 研究人員認為,從需要預先輸入人類知識,到能完全依靠自己摸索,「阿爾法圍棋」的進步標誌著人工智慧的巨大突破,因為這意味著人工智慧可以更好地進入對它來說本是一片空白的領域。
 「深度思維」公司首席執行官哈薩比斯說,他希望人工智慧的這種進步能夠被用於分析蛋白質結構、設計新材料等領域,為人們的生活帶來積極有益的影響。

副刊
亞洲蹲 為何只有亞洲人能做到

近日,「亞洲蹲」(Asian Squat)在網上突然火了,其原因是這種姿勢只有亞洲人可以完成,大部分 …

副刊
英國醫院設禁煙看守員

文/曹雪  在很多醫院,儘管有顯著的禁煙標誌,可還是有很多人視而不見。英國醫院為此也是操碎 …

副刊
最早的呼吸機叫 鐵肺

「ECMO葉克膜」一詞在抗擊新冠肺炎的報導中出鏡率很高,它是英文的「體外膜肺氧合」的縮寫,也稱「體外 …