根据原型系统进行重构思考 ::-- ZoomQuiet [2007-03-07 15:02:56]

CPUG联盟::

CPUG::门户plone

BPUG

SPUG

ZPUG

SpreadPython Python宣传

1. OBPlatfrom 的使命

通过简便的操作,可方便的管理多部图书的在线评注

1.1. 数据对象

紧紧抓住OBPlatfrom 使命的话,就发现,面对的数据其实就两种

  1. 读者的评注
  2. 图书的结构化文本
    • 当然还有注册信息什么的,和权限相关的系统信息

1.1.1. 区别对待

两种数据对象,基本上没有什么直接联系,唯一的关联就是类似[12] 的评注标记, 通过OBPlatfrom 解析后,可以在页面上呈现可点击的 Ajax 效果的评注操作...

  • 那末进行隔离处理:
    1. 评注信息放在DB中
    2. 图书文本放在外部目录中
  • 两者通过OBPlatfrom 有机结合起来

1.1.1.1. 引发好处

  • 主要页面全部可以是静态HTML,提高系统响应同时降低负荷,因为DB请求减少一半以上!
  • 可以针对图书正文进行其它处理,比如,SVN 的版本管理
  • 可以省略正文图片管理了,通过SVN/FTP/邮件 等等方式同步/更新图片即可
  • 可以自然简便的提供整书下载阅读功能了
  • 可以自然的进行分布式部署了,将静态文件都部署到其它CPU资源少的快硬盘机器,OBPlatfrom 部署在小硬盘高CPU机器....
  • ...

1.2. 体系设计

1.3. 评注标记

  • 未来OBPlatfrom 可能接受多种结构化文本组织的图书文档,所以精心选择一种扩展性好,而且所有结构化文本系统都不处理的字串组合就非常重要了

2. 进一步讨论

关于构建文档翻译平台的想法

开源社区现在有大量非常有用的文档,虽然对部分英语较好的人不存在阅读障碍,也鼓励大家尽量提高自身的英语能力,但是有一份翻译得不错的中文文档,会更加有用,毕竟使用自己最熟悉的语言是最轻松的。同时也能造福广大英语不好的人,即使翻译文档不能完全准确表达原文的意思,能让人快速了解个大概也是非常非常有用的,通常费了很多时间阅读英文资料后也只能留下一个大概的印象。总的来说,如果能够有一个方便地支持协作翻译的平台,让更多的人更容易地参与翻译和改进,将是非常好的一件事。

现在有不少翻译社区,比如译言或者其它的一些翻译型blog,他们适合翻译一些简短的新闻类文章,不便于多人共同维护一份技术文档的翻译。也有基于Wiki的协作翻译形式,但是wiki 的使用有一些门槛,在格式上也很难跟原文保持一致,针对原文档的更新也不容易。基于已有的这些并不太理想的方案,针对技术文档的特点,构建一个更适合文档翻译的平台。

先来看看文档翻译的特点:

  1. 技术文档相对新闻和blog来说,有效性时间相对要长,一篇翻译得好的文档可以让很多人受益;
  2. 技术文档是有版本概念的,会随着软件或者系统的更新而更新;
  3. 内容比较多,一个人单独完成翻译比较困难;
  4. 语句比较客观、直白和严谨,容易得到一个大多数人都能接受的翻译结果,多人协调翻页导致;
  5. 有不少相对稳定的专业词汇和概念;
  6. 文档有一定的格式,通常为HTML页面,内部会嵌入代码等。

根据这些特点,希望文档翻译平台能达到下面这些目标:

  1. 个人的翻译的过程是方便和快捷的,能够中英文对照,批量替换等;
  2. 方便地进行多人协同翻译,共同完成大量文档的翻译,个人即使只翻译一句话或者一个段落也是可参与的;
  3. 方便地进行相互校对和修订,提高翻译质量;
  4. 保持跟原文档一致的格式;
  5. 能够自动跟踪原文档的更新,并自动合并;

拟采用的方案:

  1. 将文档的翻译细化到句子甚至短语的翻译,建立文档中句子甚至短语跟翻译结果的一一对应关系,用它们替换原文档得到翻译后的文档。这样当原文更新后,翻译文档也会自动更新,新出现的语句会明显地暴露出来,便于增量翻译。同时可以保持与原文档同样的格式。
  2. 可选择以机器翻译作为初始状态进行改进,提高翻译质量,同时改进后的翻译作为用来进行机器学习。对一批文档采用项目的形式进行管理,同一个项目共享一个词库,用于进行批量替换或机器翻译时的特化词典。机器翻译最大的问题在于对专业词汇的翻译,解决了这部分后通常能得到一个基本能看明白的文档。
  3. 一个句子或者短语可以有多个翻译结果,用户可以选择最合适的翻译,投票决定最优翻译,以提高翻译质量。
  4. 交互界面上采用Google翻译的效果,页面中显示翻译后的结果,鼠标停留时可以看到原文,点击后可以选择其他翻译或者采用原文或者提交新的翻译。
  5. 可以做一个浏览器扩展或者插件,用户可以根据网页的URL,自动跳转到该平台下的相应翻译页面;

以上是我对协作进行文档翻译的一些想法,欢迎大家多提意见,最后能得到一个比较好的方案并付诸实施。

原文在我的blog上: http://blog.daviesliu.net/article/entry20070406-115711

3. 反馈

Name Password4deL ;) =D =) :P :(|) :-| :( X-( B-)
rfubhjz xpqog   mvbocdi cbnswal qxih itbm xlpokqite masxpqguv ecysx
2007-11-14 09:02:19
uslgan oluei   odkucwbg vbdnkg otxclip msarvuqph mygvnfu fiacbstkd wyzs http://www.sckie.eurjxsby.com
2007-11-14 09:03:30
eopvwun gpvqfce   krpnl tjgsp cual jhdzpcmb otjdvxq tlrwpd ocymzeua <A href="http://www.ckxr.fzmobah.com">pghixe ojme</A>
2007-11-14 09:03:48
zigayudmt auvefwqnb   bdcv wtglmyosr xthea ptfkwuv yrxzcvwa rauwqsfc luqbmy [URL=http://www.lyext.rejkcmv.com]lhif mqwpdsvf[/URL]
2007-11-14 09:06:42
onjkrq rugicst   vulkfqy fawzmhlb fwqcyx dpksjrg onltxc uzevolqx bjsnt [URL]http://www.ykwf.abwfned.com[/URL] yzbi xioqg
2007-11-14 09:08:04