机械社区

 找回密码
 注册会员

QQ登录

只需一步,快速开始

搜索
查看: 3905|回复: 11

突发奇想,如果使用2台alphaGO主机,使用同样的算法和策略,互奕一局,结局如何?

[复制链接]
发表于 2016-3-10 18:31:07 | 显示全部楼层 |阅读模式
这个是不是有点自相矛盾的味道?? 但是我对结果很感兴趣
回复

使用道具 举报

发表于 2016-3-10 18:42:38 | 显示全部楼层
这算是“迭代”吗,昨天也想到这个了- w; w" d! T- p% O3 t
以后办围棋赛,可以分设AI组与人类组,

点评

这东西只要胜一次,以后就会无敌的,跟人不同,人是有年纪的,到一个年纪会出昏招,而这东西是学了所有‘败者’的棋谱,做‘博弈统计’,用概率跟你玩,你肯定就没戏了,如果留下一个高手是‘胜者’,则可以再撑  发表于 2016-3-10 18:51
回复 支持 2 反对 0

使用道具 举报

发表于 2016-3-10 18:42:49 | 显示全部楼层
胜负五五开吧
回复 支持 2 反对 0

使用道具 举报

发表于 2016-3-10 18:46:55 | 显示全部楼层
早已经自我进化3000多万局啦" }; f, o$ n4 Q8 P2 j, n' h/ x. C2 e

- @2 G7 T: H9 L靠人来比试获取电脑算法经验值的速度太慢
2 q( J" x; I' g+ E( `
回复 支持 1 反对 1

使用道具 举报

发表于 2016-3-10 18:47:33 | 显示全部楼层
不会的,依然是一方赢,并且肯定是一方赢,毫无疑问,; d4 Q) C0 U3 i! G

7 ]) b7 d) K/ m因为每个系统是一个小组,其‘策略’是完全不同的,就是那个‘总策略’的算法与智商水平,决定了谁是赢家,这家伙假如到赌场,肯定被‘劝阻’的,跟山本一个级别,山本就进不了赌场,
8 C4 N' H! Q. c1 ~# z  L9 U0 g6 L" T/ ?$ L# l
这个,就跟我玩自动装配是一个道理,你装配车的路径每个人算法是不同的,最终效率是不同的,) ^  ~3 Q) G7 ~: h. [: x1 x# B

& I/ U6 e' b, b古狗其实就是向全世界宣布,阿拉是‘老大’,以前是IBM是老大,再后来是洛马,. y# f! Y. |- b6 ?7 D( O; }
9 C- i8 u8 `5 q8 b
洛马被熊给戏了一次,丢了大面子,但迅速就找回来了,依然用170飞,就是‘挑战与赌气’,哈哈,
- C( q- i3 f4 }: w) I% i: m
! Q5 k; U" D. V+ ?" J% \跑速度与航程,跑不过诺格,有点‘丢分儿’哈哈,
( u- ]% {" k' \8 t: _( s# I* o& j* e- K6 P( S
总体说水平,可能现在还是洛马第一,古狗大概排第二,因为洛马玩这些东西的人,是古狗的好多倍,但也不排除古狗里面有一个‘绝世天才’,跟布劳恩一样的家伙,
: d. N% w& v- w  M: z5 e
2 \/ s: M/ B7 r: C- v( G就像中国专家希望在‘神农架’里面找的‘非凡者’,哈哈,他们跟俺说这些,俺哈哈大笑,
0 ~( |/ E8 U* Q( F1 |1 a( u( B' t0 |
4 v5 ]7 i* v+ S+ Q# Q5 p4 z; U中米社会条件不同,论侃,米国肯定不是对手,哈哈,
回复 支持 2 反对 0

使用道具 举报

 楼主| 发表于 2016-3-10 18:48:23 | 显示全部楼层
灭嘎嘎 发表于 2016-3-10 18:42
" G1 c' A5 {$ ]胜负五五开吧
0 U$ S) ?% y- q9 {: V3 g4 v3 }  m
我曾经在一台双路E5 2680 v2的主机上,使用软件对软件下象棋,总计25盘,本来我以为,这个应该遵循p=0.5的0-1分布,但是,结果让人意想不到,红对蓝,红胜22盘- h; B, I6 v# F" z# e7 q
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-3-10 18:49:40 | 显示全部楼层
2266998 发表于 2016-3-10 18:47 ! }$ @( q: d# C8 D0 ?: s
不会的,依然是一方赢,并且肯定是一方赢,毫无疑问,/ V4 o* F! M% n- Y8 ~' Z
5 \: P0 z% o' S$ h$ W
因为每个系统是一个小组,其‘策略’是完全不同的 ...

9 D3 p- p4 W  j( q我曾经在一台双路E5 2680 v2的主机上,使用软件对软件下象棋,总计25盘,本来我以为,这个应该遵循p=0.5的0-1分布,但是,结果让人意想不到,红对蓝,红胜22盘;看来就像8爷所说的那样,还是一方赢
2 r1 a! V4 E$ ?* T% }; U* @2 q  J
回复 支持 反对

使用道具 举报

发表于 2016-3-10 19:30:11 | 显示全部楼层
马上fps,rts游戏也要没意思了,阿尔法狗下一个目标就是星际争霸。( }% w; z7 _3 ]& {

' A8 v% X7 V' ]/ l! S8 S3 A幸好我已经是剧情党了。
回复 支持 反对

使用道具 举报

发表于 2016-3-10 19:34:25 | 显示全部楼层
看了下DeepMind团队发表在Nature上的文章,AlphaGO深度学习、蒙特卡罗树状搜索、自我进化三大招齐出。换句话说,最开始的时候AlphaGO并不会下棋,怎么走完全靠随机蒙,那些蒙对的走法会记忆下来,那些蒙错的走法会淘汰,这就是训练。等下次再对弈时,就会使用上次蒙对的走法。经过上万次甚至甚至上亿次的训练淘汰,水平会不断上升,也就实现了自我进化。
/ R7 ]* P+ ^: l. C' z" n根据这个原理,两个AlphaGO对弈,总会有一个获胜,获胜的新的走法会保留,失败的会淘汰,实现进化。这很像人类的自然进化法则,这也正是AkphaGO厉害的地方。
  d3 B( c( s2 X) j% M/ g2 [事实上目前AlphaGO的技能很大程度上都是通过自己左右互搏学习到的。

评分

参与人数 2威望 +2 收起 理由
不懂的太多xx + 1
爱猫人士薛定谔 + 1

查看全部评分

回复 支持 反对

使用道具 举报

发表于 2016-3-11 09:43:48 | 显示全部楼层
外太空这要这家伙去开疆拓土,进化吧
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

小黑屋|手机版|Archiver|机械社区 ( 京ICP备10217105号-1,京ICP证050210号,浙公网安备33038202004372号 )

GMT+8, 2024-4-29 22:58 , Processed in 0.058692 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表