htmlSQL类中文的介绍

原文:http://www.jonasjohn.de/lab/htmlsql.htm

翻译者: Deloz

说明:我习惯使用htmlSQL类采集,对照原文根据自己理解翻译这个中文版htmlSQL类的介绍和使用方法,是为了方便自己的学习,我英文不好, 见笑了.^_^  如有错误请高手斧正.

htmlSQL是一个允许你使用类似SQL一样语法去访问网站内容(XML/HTML文件)的类库.意思就是,你不用再去写复杂的函数(或正则表达式)去读取HTML中特定的内容了.这个php采集类用来采集是相当好用的哈.

htmlSQL使用类似SQL的语法,如下所示:

SELECT href,title FROM a WHERE $class == “list”

这个查询返回一个数组:  所有class名为list的链接地址

htmlSQL类中文介绍(Deloz翻译)

htmlSQL类的网络操作方式是使用了强大的Snoopy类(package version 1.2.3 – URL: http://snoopy.sourceforge.net/),但是如果是使用htmlSQL操作文件或者字符串,并不需要用到Snoopy这个类.

怎么使用htmlSQL?

在php中包含snoopy.class.php和htmlsql.class.php,然后参考例子使用.

为什么会有htmlSQL这个类?

我在从一个网站上提取数据的时候产生了这个想法. 我经常重复使用一些的算法和函数来提取网站的链接和其他标签,我就想,把这些函数合并成一个通用的类.我边喝咖啡边想这个问题,我认为使用类似SQL的语法去访问网站内容会很酷的.所以,我开始创造这个类…

注意:

eval()函数被用来作WHERE条件.执行程序前要检查用户输入的数据和恶意PHP代码.

需要改进的地方:

1,增强HTML的解析
2,测试htmlSQL在HTML代码不完整时下的情况
3,想个函数替换掉邪恶的eval()函数.
4,更多的错误检查.
5,添加类似SQL查询的LIMIT函数和限制条件.

LICENSE:

htmlSQL uses a modified BSD license, you find the full license text
in the “htmlsql.class.php”.

下载地址:

htmlsql-v0.5.zip (42 KB)   htmlsql-v0.5.tar (144 KB)[官方下载]

本站下载

2 Responses to “htmlSQL类中文的介绍”

  1. hisnake says:

    好复杂,号复杂… :?: :neutral:

  2. HackJune says:

    下载不了!!! 哪位大哥、大姐 … 好心给我发一份… 急需! 谢谢… 忘记发联系方式了 , 可以发到我邮箱:liwenjune@sina.com

Leave a Reply

最新文章

最新评论

点击最多

分类存档

合作伙伴