說起AI下圍棋,AlphaGO早在2016年就一戰(zhàn)成名。隨后,AI在棋力、效率、通用性等方面均有顯著提升,但其具體推理過程仍為“黑盒”,即便能輸出勝率評估和落子概率,亦無法用人類語言解釋“為什么某一步更好”。典型表現(xiàn)為:AI有時(shí)會(huì)下出違背人類直覺的“天外飛仙”棋步,事后被證明有效,但當(dāng)時(shí)難以解釋。
4166am金沙登陆5月23日,澎湃新聞(www.thepaper.cn)從上海人工智能實(shí)驗(yàn)室(上海AI Lab)了解到,基于一系列“通專融合”底層技術(shù)新進(jìn)展,實(shí)驗(yàn)室推出的書生·思客(InternThinker)獲得專業(yè)推理能力大幅提升,成為首個(gè)既具備圍棋專業(yè)水平,又能展示透明思維鏈的大模型。
而這些技術(shù)進(jìn)展,根本上是得益于近期上海AI Lab在“通專融合”路線的底層技術(shù)和架構(gòu)方面的一系列創(chuàng)新突破。大模型發(fā)展歷程主要分化為專業(yè)性和通用泛化性兩大路線,上海AI Lab率先提出“通專融合”技術(shù)路線,著力解決大模型高度專業(yè)化與通用泛化性相互制約的發(fā)展困境。這一路徑的關(guān)鍵在于同步提升深度推理與專業(yè)泛化能力,使模型不僅在廣泛的復(fù)雜任務(wù)上表現(xiàn)出色,還能在特定領(lǐng)域中達(dá)到專業(yè)水平。
在棋力方面,InternThinker未來仍有提升空間。新生代世界圍棋冠軍王星昊九段在與其對弈后評價(jià)道:“能解說思考過程的AI還是第一次見,感覺它分析得非常好,從布局看棋力可能在職業(yè)3-5段之間。”
回顧當(dāng)年AlphaGO和李世石的交戰(zhàn),第四盤78手李世石落在L11,被世界圍棋八冠王古力稱為“神之一手”,直接扭轉(zhuǎn)了局勢取得最終勝利。在研究人員對該名局的復(fù)現(xiàn)中,InternThinker評價(jià)這步棋“相當(dāng)?shù)筱@”,隨后給出了落子在L10的應(yīng)對策略,認(rèn)為能夠完美解決L11的威脅,重新確立中央控制權(quán),為后續(xù)進(jìn)攻埋下伏筆。
目前,InternBootcamp技術(shù)已對外開源。上海AI Lab表示,將系統(tǒng)推進(jìn)通專融合技術(shù)路線的發(fā)展與探索,將通專融合的新能力、新進(jìn)展持續(xù)通過InternBootcamp對外開放,加速以新一代通專融合基座模型的方式解決具體科學(xué)發(fā)現(xiàn)中的關(guān)鍵問題,同時(shí)牽引打造垂直領(lǐng)域示范應(yīng)用案例,為科學(xué)發(fā)現(xiàn)與產(chǎn)業(yè)創(chuàng)新提供關(guān)鍵驅(qū)動(dòng)力。
隨著InternBootcamp任務(wù)的數(shù)量增加、質(zhì)量提升和難度加大,大模型有望迎來能力的“升華”,高效解決更多、更難、更具實(shí)用性的推理任務(wù),在助力大模型推理能力泛化的同時(shí),加速推動(dòng)科學(xué)發(fā)現(xiàn)。
研究團(tuán)隊(duì)創(chuàng)造性地構(gòu)建了一個(gè)“加速訓(xùn)練營”(InternBootcamp),通過對評價(jià)建模,與大模型進(jìn)行交互并提供反饋,從而使大模型持續(xù)進(jìn)化,獲得解決復(fù)雜推理任務(wù)的能力。通過該方法,InternThinker已實(shí)現(xiàn)在奧賽級數(shù)學(xué)、科學(xué)對象理解與推理、算法編程、棋類游戲、智力謎題等多個(gè)專業(yè)任務(wù)同步學(xué)習(xí)演進(jìn),并在多任務(wù)混合強(qiáng)化學(xué)習(xí)過程中出現(xiàn)智能“涌現(xiàn)時(shí)刻”。
而升級后的InternThinker,在圍棋任務(wù)上不僅具備較強(qiáng)的專業(yè)水平,還在大模型中率先實(shí)現(xiàn)打破思維“黑盒”,運(yùn)用自然語言對弈過程進(jìn)行講解。用戶在與InternThinker對弈的過程中,大模型能全面地分析當(dāng)前局面形勢,對不同的落子點(diǎn)進(jìn)行判斷和對比,并給出明確的結(jié)果,讓用戶了解每一步棋背后的推理過程和決策依據(jù),從而幫助用戶更好地理解和學(xué)習(xí)圍棋。
...游戲版本 V7.6.3 | 大小 78.86M |
系統(tǒng)要求 安卓5.7 | 更新時(shí)間 2025-06-06 06:30:53 |
語言 中文 | 開發(fā)商 |
適齡范圍 12+ |
修復(fù)bug
7.8
5.2
4.7
3.6
6.4
7.6
6.7
4.7
7.7
不一樣的好游清單
帶你發(fā)現(xiàn)更多有意思的新游戲
聯(lián)系我們意見反饋隱私政策侵權(quán)投訴防沉迷須知
本公司產(chǎn)品適合10周歲以上玩家使用未成年人家長監(jiān)護(hù)
抵制不良游戲 拒絕盜版游戲 注意自我保護(hù) 謹(jǐn)防受騙上當(dāng)
適度游戲益腦 沉迷游戲傷身 合理安排時(shí)間 享受健康生活
ICP證:ICP備59673957號-1網(wǎng)站地圖
? 2009 - 2024 http://www.tf31.com All Rights Reserved.
9.55W人評價(jià)