htmlSQL类中文的介绍
原文:http://www.jonasjohn.de/lab/htmlsql.htm
翻译者: Deloz
说明:我习惯使用htmlSQL类采集,对照原文根据自己理解翻译这个中文版htmlSQL类的介绍和使用方法,是为了方便自己的学习,我英文不好, 见笑了.^_^ 如有错误请高手斧正.
htmlSQL是一个允许你使用类似SQL一样语法去访问网站内容(XML/HTML文件)的类库.意思就是,你不用再去写复杂的函数(或正则表达式)去读取HTML中特定的内容了.这个php采集类用来采集是相当好用的哈.
htmlSQL使用类似SQL的语法,如下所示:
SELECT href,title FROM a WHERE $class == “list”
这个查询返回一个数组: 所有class名为list的链接地址

htmlSQL类的网络操作方式是使用了强大的Snoopy类(package version 1.2.3 – URL: http://snoopy.sourceforge.net/),但是如果是使用htmlSQL操作文件或者字符串,并不需要用到Snoopy这个类.
怎么使用htmlSQL?
在php中包含snoopy.class.php和htmlsql.class.php,然后参考例子使用.
为什么会有htmlSQL这个类?
我在从一个网站上提取数据的时候产生了这个想法. 我经常重复使用一些的算法和函数来提取网站的链接和其他标签,我就想,把这些函数合并成一个通用的类.我边喝咖啡边想这个问题,我认为使用类似SQL的语法去访问网站内容会很酷的.所以,我开始创造这个类…
注意:
eval()函数被用来作WHERE条件.执行程序前要检查用户输入的数据和恶意PHP代码.
需要改进的地方:
1,增强HTML的解析
2,测试htmlSQL在HTML代码不完整时下的情况
3,想个函数替换掉邪恶的eval()函数.
4,更多的错误检查.
5,添加类似SQL查询的LIMIT函数和限制条件.
LICENSE:
htmlSQL uses a modified BSD license, you find the full license text
in the “htmlsql.class.php”.
下载地址:
htmlsql-v0.5.zip (42 KB) htmlsql-v0.5.tar (144 KB)[官方下载]
好复杂,号复杂…
下载不了!!! 哪位大哥、大姐 … 好心给我发一份… 急需! 谢谢… 忘记发联系方式了 , 可以发到我邮箱:liwenjune@sina.com