PyCrawlVer -- 公众视频信息爬虫

::-- ZoomQuiet [2006-12-01 07:10:46]

啄木鸟项目::

{o} PyCrawlVer

1. 缘起

描述项目是如何发起的

1.1. 项目日志

<< <  2007 / 11 >  >>
Mon Tue Wed Thu Fri Sat Sun
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    

CPUG联盟::

CPUG::门户plone

BPUG

SPUG

ZPUG

SpreadPython Python宣传

提要

1.2. 目标

总体目标: 
        
        快速获取15个知名视频网站上的视频元信息。


具体要求:
        1、给定一个视频网站上的入口URL,自动分析判断其站点所有公开视频的URL。
        2、视频格式不限,至少包括flash/wma/rm/mpeg等。
        3、元信息至少包括:题目、介绍、作者、发布日期、其他、评论次数、
观看次数、HTML嵌入代码、BBS嵌入代码、Blog嵌入代码、来源、URL。但不包括视
频本身。
        4、将获得的元信息提交至MYSQL的DB。
        5、开放源代码,最好用Python实现,这里可提供一个范例程序(python),以供参考。。
        6、性能要求:大于20000条/每天。
        
报酬及其它要求:
    
        1、要求北京见面,因为以上为概要需求,更详细的需要面谈。
        2、10-15天内全部完成,前5个收到后,付400RMB,其余600RMB全部收到后付清。
       
回复邮件地址:

        有兴趣的朋友,请联系:
        email: li.monan%gmail.com

1.3. 计划

1.4. 成员

1.5. 成果

2. 反馈

项目讨论