飞扬围棋

 找回密码
 注册
搜索
查看: 24957|回复: 45
打印 上一主题 下一主题

职业棋手棋谱数据库分功整理工程

[复制链接]
跳转到指定楼层
1#
发表于 2004-4-2 18:27 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
职业棋手棋谱数据库分功整理有兴趣吗?[讨论]

职业棋手棋谱数据库分功整理有兴趣吗?

各位,我目前在并入GoGoD(23,200棋谱)以后,我的(estone)棋谱数据库有44,000左右。今晚再并入某棋友交换的18,000左右,我想会达到47,000或48,000棋谱左右。

因为最近使用GoGoD中的GoLibrary它的棋谱搜索,编入索引,棋手实绩统计图表确实好用。甚至可以做棋手A对棋手B的成绩比率!

实际上我在之前上传的棋谱列表就是使用它直接搜索与输出的。我试验了中文棋谱归档,它可以支持中文的棋谱输入与输出,因为是输出到txt为处理的格式。

我打算把棋谱数据库全部棋谱变换为中文,目前棋谱数据库混合了中英棋谱。使用上来不方便。名字标准化也要做,搜索方便。

因为个人空闲时间有限,打算使用分功整理的方法与多人分功整理如10年为单位,按照GoDatabase的档案排序整个中文化。一来我个人节省时间,二来分功整理可以分享成果,如何?

中文化后的棋谱数据库可以使用在Kombilo 0.5k以上,它是支持中文的。如此一来,可以做棋形搜索,比较职业棋士的下法与自己的差别,又有比较完全的棋谱数据库做打棋来使用.

全部棋谱会使用multigo过滤除去US栏的信息,与转化为纯粹sgf文件,方便未来整合。

听听各位意见与见解。

谢谢


就算通过kombilo做细节搜索重制棋谱,应当保守的有40,000棋谱以上。

题外话:此外GoGoD的词典也是可以输入输出中文。谁有兴趣增加更新中文数据?



[此贴子已经被作者于2004-5-12 23:26:23编辑过]

2#
 楼主| 发表于 2004-4-3 13:11 | 只看该作者
你好,
应如何称呼呢?我全名林金强,马来西亚华人。

首先谢谢你的兴趣参与棋谱整理计划。棋谱数据库在我的手上。我想如果有10位参与,平均每一个人要处理5,000棋谱(50,000/10人)。如果二人,每一个人25,000棋谱,十分疲劳的工件量。

棋手名字以gobase.org的为准。比赛名也是,如Gosei 应是日本碁圣战,不是小棋圣战等等。日本名人战与中国名人战也要注解明确。如果仍然有不能够翻译的名字,列出我在想想办法或要求日本棋友解释一下。错误手数与省略手数必须写在评注栏(Comment)。还有,关于日期格式标准化为yyyy-mm-dd 如不知道月可以写成 1975-00-00 或者1975-winter(冬季),等等。
成绩标准化跟随日本计算目,因此中国的棋谱结果要转化然后写上,(在注解栏备注原来的结果)。

还有其它问题?

因为尊重出力的棋友,应仅与他们分享成果,不回上传公开,这方法如何?

谢谢

lim_kimkeong@hotmail.com
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2004-4-3 13:17 | 只看该作者
数据库folder directory structure

Database\

0196-1699
1700-99
1800-49
1850-99
1900-09
1910-19
1920-29
1930-39
1940-49
1950-59
1960-69
1970-75
1976-79
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004

谢谢
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2004-4-3 13:36 | 只看该作者
基本上来说,比较缺乏的是欧美的棋战,日本的关西棋院的比赛等等比较冷门的棋战(对东方人来说)。

谢谢
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2004-4-3 13:54 | 只看该作者
举个具体的例子!

英语棋谱
Otake Hideo Takemiya Masaki 7th Gosei, final game 3 R: B+3.5 Date: 1987-3-08 location: nihon ki-in
illegal move (173)

翻译成为
大竹英雄 武宫正树 第7期碁胜战决赛第3局 R:黑胜3目半 D:1987-03-08 L:日本棋院
评注栏(Comment): 错误手数(173手)

谢谢
回复 支持 反对

使用道具 举报

6#
发表于 2004-4-2 19:26 | 只看该作者
造福人民的一件大好事啊
回复 支持 反对

使用道具 举报

7#
发表于 2004-4-2 20:20 | 只看该作者
呵呵,有林兄这样的棋友真飞扬和我们的福气啊
回复 支持 反对

使用道具 举报

8#
发表于 2004-4-2 20:27 | 只看该作者
请说仔细一点.我原出力!
回复 支持 反对

使用道具 举报

9#
 楼主| 发表于 2004-4-3 01:54 | 只看该作者
以下是引用wwazz在2004-4-2 20:27:34的发言:
请说仔细一点.我原出力!


详细情况

50,000棋谱30~40%英语棋谱信息需要转化为全中文(使用在棋谱搜索,列表,实绩比较,棋形研究等等)

1. 需要分工,把棋谱分割成为比较小单位如年或时代,个人整理分配的单位,翻译英语棋谱成为中文。例子:如一人负责10年部分的棋谱。

2. 然后从estone输出成为单独的sgf棋谱。然后使用multigo过滤(batch processing)除去US栏信息(除去版权),转化为纯粹的sgf4棋谱。

3. 输入进入kombilo0.5k,确保使用中文编码encode,选择拒绝完全相同的棋谱,与比较每一手棋。Kombilo处理后会显示问题如某一棋谱“illegal move (173)”(把这信息输入那一棋谱的注解栏里面“错误(173手)”)或某两棋谱完全相同(选择除去评论与手数比较少的)。

4. 之后按照yyyy-mm-ddx成为文件格式。例子:meijin-otake-ishida.sgf 成为 2003-05-13a.sgf 2003-05-13b.sgf 等等 确保每一个棋谱有唯一的文件名字(之后从搜索到的需要棋谱可以输出全部到指定的地方)。

这就完成了部分的棋谱可以使用在学习了。


谢谢


希望解释清楚了。
回复 支持 反对

使用道具 举报

10#
发表于 2004-4-3 10:39 | 只看该作者
请看我给你发的短信!
回复 支持 反对

使用道具 举报

11#
发表于 2004-4-3 19:08 | 只看该作者
林兄你好,
estone 具有过滤US等信息的功能,还有英文姓名自动翻译成中文的功能,希望这些功能能对你有用.
希望你能做成功,不过我没有时间来帮忙.
回复 支持 反对

使用道具 举报

12#
 楼主| 发表于 2004-4-4 18:01 | 只看该作者
各位,

我整理了2004 1到3月棋谱,请看结果举例说明:-

可以搜索棋谱与做棋手实绩比较,好用吧。

<img src="attachments/dvbbs/200444180852643.jpg" border="0" onclick="zoom(this)" onload="if(this.width>document.body.clientWidth*0.5) {this.resized=true;this.width=document.body.clientWidth*0.5;this.style.cursor='pointer';} else {this.onclick=null}" alt="" />
<img src="attachments/dvbbs/2004441803176538.jpg" border="0" onclick="zoom(this)" onload="if(this.width>document.body.clientWidth*0.5) {this.resized=true;this.width=document.body.clientWidth*0.5;this.style.cursor='pointer';} else {this.onclick=null}" alt="" />
<img src="attachments/dvbbs/200444181281125.jpg" border="0" onclick="zoom(this)" onload="if(this.width>document.body.clientWidth*0.5) {this.resized=true;this.width=document.body.clientWidth*0.5;this.style.cursor='pointer';} else {this.onclick=null}" alt="" />
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2004-4-4 18:05 | 只看该作者
以下是引用zuolin在2004-4-3 19:08:38的发言:
林兄你好,
estone 具有过滤US等信息的功能,还有英文姓名自动翻译成中文的功能,希望这些功能能对你有用.
希望你能做成功,不过我没有时间来帮忙.


zuolin兄的estone好用是不用说了,

因为要达成理想成果,multigo batching processing 成为纯粹的sgf4格式,同时除去US 与 SO栏信息对这案例是需要的。

谢谢
回复 支持 反对

使用道具 举报

14#
 楼主| 发表于 2004-4-4 18:09 | 只看该作者
各位,

希望更多的人能够参与分工,工件量也自然的减低,结果快看到与能够使用。

谢谢


完成的棋谱数据库会电邮给参与者的。
可以电邮我 lim_kimkeong@hotmail.com


[此贴子已经被作者于2004-4-5 0:01:24编辑过]

回复 支持 反对

使用道具 举报

15#
发表于 2004-4-5 09:20 | 只看该作者
林先生:
    我愿意做,我基本上可以看到日本的棋手的英文名字,马上反映出他的中文名字,我也有GoGoD程序 ,你可以传一点给我,我试试
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-11-17 04:38 , Processed in 0.151185 second(s), 19 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表