首页 科技 前瞻 正文

“阿尔法零”人工智能再进化:24小时之内“通杀”3种棋

2017年12月07日 18:49:52  来源:北京晚报  编辑:叶子

英国“深度思维”公司最新发布的论文说,该公司一种通用棋类人工智能“阿尔法零”能从零基础开始强化学习,24小时之内击败了此前最强的国际象棋、日本将棋和围棋人工智能程序,由此前专攻一项技能走向多种技能“通杀”。

冯晨清制图

“深度思维”公司在最新论文中透露,“阿尔法零”从零开始,通过自我对弈强化学习,约2小时击败日本将棋顶级人工智能程序,4小时击败国际象棋顶级人工智能程序,8小时击败战胜韩国棋手李世石的“阿尔法围棋-李”,并在24小时内战胜了通过72小时自我学习训练称王围棋的“阿尔法围棋-零”。

10月,“阿尔法围棋-零”第一次让人工智能在不“学习”任何既定棋谱、只设定规则的情况下,完全“从零开始”、自我对弈取得飞速进步。而此次的“阿尔法零”在此基础上训练了3种独立的程序,其中国际象棋程序自我对弈4400万局,日本将棋程序自我对弈2400万局,围棋对弈了2100万局。

一些人工智能专家表示,人工智能完全依靠自己摸索,意味着人工智能可以更好地进入对它来说本是一片空白的领域;而“阿尔法零”的问世显示人工智能可以向通用化发展,为诸如开发新药这种与棋类游戏一样有明确规则和目标的问题提供发展蓝图。

英国“深度思维”公司最新发布的论文说,该公司一种通用棋类人工智能“阿尔法零”能从零基础开始强化学习,24小时之内击败了此前最强的国际象棋、日本将棋和围棋人工智能程序,由此前专攻一项技能走向多种技能“通杀”。

冯晨清制图

“深度思维”公司在最新论文中透露,“阿尔法零”从零开始,通过自我对弈强化学习,约2小时击败日本将棋顶级人工智能程序,4小时击败国际象棋顶级人工智能程序,8小时击败战胜韩国棋手李世石的“阿尔法围棋-李”,并在24小时内战胜了通过72小时自我学习训练称王围棋的“阿尔法围棋-零”。

10月,“阿尔法围棋-零”第一次让人工智能在不“学习”任何既定棋谱、只设定规则的情况下,完全“从零开始”、自我对弈取得飞速进步。而此次的“阿尔法零”在此基础上训练了3种独立的程序,其中国际象棋程序自我对弈4400万局,日本将棋程序自我对弈2400万局,围棋对弈了2100万局。

一些人工智能专家表示,人工智能完全依靠自己摸索,意味着人工智能可以更好地进入对它来说本是一片空白的领域;而“阿尔法零”的问世显示人工智能可以向通用化发展,为诸如开发新药这种与棋类游戏一样有明确规则和目标的问题提供发展蓝图。

举报本文
+10
+10

依据《信息网络传播权保护条例》第二十二条之规定,即“避风港原则”,本站所有文章及内容系第三方作者上传,如有侵权行为请及时联系本站客服删除,本站不对内容传播行为承担赔偿责任。

GOOGLE人工智能深度学习有成 人机围棋对决在即

随着技术的演进,AI人工智能再度进化,Google、Facebook相继发展人工智能,不过Google似乎更甚一筹。Google位于伦敦的人工智能团队DeepMind所开发的现代版“佐为”AlphaGo,携深度学习技术,预计从3月9日起,与全球知名的韩国围棋冠军棋手李世石进行5场对弈,藉此向全世界证明一个具有自我学习能力的人工智能,正走向一个新的里程碑。

同盾科技:迎接智能时代人工智能时代的金融风控

随着金融服务向线上迁移,大量风险漏洞和欺诈套利的行为会在线上集中爆发,传统风控模式已经无法抵御来自线上的风险,人工智能和风控深度整合,是整个行业发展的大势所趋。近期,同盾科技创始人、董事长蒋韬受中......

《认知安全白皮书》发布 让人工智能未来更安全

2018年8月15日,由梆梆安全研究院编撰的《认知安全白皮书》(以下简称“白皮书”)正式对外发布。梆梆安全是最早认识到人工智能安全风险并展开认知安全研究的公司之一,白皮书中首次明确提出认知安全的定义......

使用加推人工智能名片:如何提升销售能力与技巧

想要成为销售高手,就要通过不断的学习来提高自己。既要向同事也学,也要向客户学习,甚至要向时代学习。1、向同事"取经"无论你多精明强干,总会有人超过你。这些人或许比你更精明,也可能销售上比你更有......

跟贴 0
参与 0
发贴
网友评论仅供其表达个人看法,并不表明E都市立场。