网页抓取例子 - guoyiqi - ITeye博客

`

guoyiqi

浏览: 965173 次

最近访客更多访客>>

wry3407

zzc125

bingjava

秋天你慢慢来

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

18335864773：很多公司项目都在使用pageoffice 来操作word，e ...
用java生成word文档
Gozs_cs_dn：请问下博主, 怎样将sitemesh3.xsd绑定 sitem ...
SiteMesh3配置
Rose_06：
springside4.0quick-start.bat报错原因
ilemma：我也是刚参见工作啊,经理让自学这个,有些东西不太懂,能不能发个 ...
Apache Shiro在Web中的应用
shanbangyou：你废了
程序员上班打酱油的方法

网页抓取例子

博客分类：

jsp

阅读更多

<%@ page contentType="text/html;charset=gb2312"%>
<%

String sCurrentLine;

String sTotalString;

sCurrentLine="";

sTotalString="";
String temp="";
java.io.InputStream l_urlStream;

for(int i=14;i<=22;i++){

java.net.URL l_url = new java.net.URL

("http://www.dltcedu.org/index_5/html/994"+i+".shtml");

java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection)

l_url.openConnection();

l_connection.connect();

l_urlStream = l_connection.getInputStream();

java.io.BufferedReader l_reader = new java.io.BufferedReader(new

java.io.InputStreamReader(l_urlStream));

int start=-1;
while ((sCurrentLine = l_reader.readLine()) != null)

{
if((start=sCurrentLine.indexOf("<div style=\"overflow:hidden"))!=-1){
temp=sCurrentLine.substring(start,sCurrentLine.length());
sTotalString+=temp.replaceAll("/UploadFile","http://www.dltcedu.org/UploadFile");

break;

}
//sTotalString+=sCurrentLine;

}
while ((sCurrentLine = l_reader.readLine()) != null)

{
if((start=sCurrentLine.indexOf("</P></p></div>"))!=-1){

temp=sCurrentLine.substring(0,(start+14));
sTotalString+=temp.replaceAll("/UploadFile","http://www.dltcedu.org/UploadFile");

break;

}

sTotalString+=sCurrentLine.replaceAll

("/UploadFile","http://www.dltcedu.org/UploadFile");;

}

}//for
out.println(sTotalString);

%>

oh.rar (619 Bytes)
下载次数: 9

分享到：

转：gbk, gb2312,big5,unicode,utf-8,utf-1 ... | 代码控管工具比较

2010-08-12 15:38
浏览 749
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

.NET 网页抓取例子（天气）: .NET 网页抓取例子（天气） .NET 网页抓取例子（天气）

htmlparser抓取网页内容: 自己写的一个网页抓取例子。抓取国家专利局的专利状态。

C++网页抓取源码及例子亲测可用: 包含源代码及测试URL，抓取url.txt中的URL的内容，保存成txt

HtmlPage 爬虫抓取网页新闻例子: 爬虫抓取网页新闻例子 HtmlPage用法例子 java文件代码例子

网页数据抓取源码例子: <?xml version="1.0"?>  ;database=Crawl;uid=sa;password=123456"/> <!-- 设置 compilation debug="true" 可将调试符号插入到 ...C# .Net 数据抓取爬虫参考

Python实现抓取HTML网页并以PDF文件形式保存的方法: 今天介绍将HTML网页抓取下来，然后以PDF保存，废话不多说直接进入教程。今天的例子以廖雪峰老师的Python教程网站为例：http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000 二、...

delphi抓取网页信息例子【附源码哟】: 这是由delphi xe10.1写的，里面都是中文变量，应该很容易看懂我也是新手，在网上试着教程做，终于看懂了，于是自己简化和修改，让新的菜鸟们更容易上手理解。...内附程序演示以及源码分享，还有原始网页信息看代码

Python抓取页面、Pthon爬虫参考资料: 本文档包括在网上搜集的众多基于Python的网页抓取实例，包括代码及说明，不是原创，只是收集了一下里面有些例子确实很不错，看了几个例子我尝试编写了个QQ空间日志备份程序，效果还不错（详见资源： ...

htmlparser实现从网页上抓取数据（+例子）: 是实现用htmlparser解析html，例子还有java解析xml。自己写的例子与大家分享！

java根据json规则抓取(新浪新闻、百度新闻、微博动态)的网页内容源码: 导入Hbase的jar包即可直接返回Put对象数据、可以返回map对象数据、支持自定义json格式抓取指定网页的内容、抓取指定时间段内容、抓取指定关键内容、对新闻进行正负面分类、对时间的格式进行了统一的维护、可抓取指定...

小偷程序（模拟请求，抓取网页内容）: 很多朋友多问过我如何抓取网页的内容，其实并不难，但是对于网页的分析却不是很简单，以前我接触正则表达式比较少，就自己去分析页面，结果是要么抓到的数据不准，要么就根本抓不到。现在写了两个类给朋友们用，...

jsoup抓取网页内容: 这是一个使用jsoup抓取网页内容的例子，适合从事手机开发的初学者学习

抓取网站内容，获取网站内容，读取网站所有内容，抓取网页内容: 这个小例子实现了抓取网站内容，获取网站内容，读取网站所有内容，抓取网页内容，获取网页内容，读取网页所有内容，得到上次访问URL，得到请求的URL，很不错的喔！！！赶紧下啦。。

htmlparser实现从网页上抓取数据doc: htmlparser实现从网页上抓取数据doc

python模拟爬虫抓取网页内容采集网页.rar: 采集网页的内容，这里主要是模拟抓取新浪微博中的内容，里面包括了[源码] 爬取客户端微博信息、[源码] 爬取移动端个人信息关注id和粉丝id (速度慢)、[源码] 爬取移动端微博信息 (强推)等多个例子，关于运行本例子的...

Python网络爬虫项目开发实战_数据抓取_编程案例解析实例详解课程教程.pdf: 虽然这个例子很有意思，却不够实用，因为爬虫在下载网页之后又将结果丢弃掉了。现在，我们需要让这个爬虫从每个网页中抽取一些数据，然后实现某些事情，这种做法也被称为抓取（scraping）。首先，我们会介绍一个叫做...

c++多线程抓取网页代码: 想实现用c++下载网页，这是个很好的例子

VB6.0抓取网络数据包代码.rar: VB6.0演示如何抓取网络数据包，截获网络包的例子，原型是一个网络原始数据包嗅探器的修正版代码，程序基于winsock API，支持TCP,UDP和ICMP三种协议数据的抓取，支持记录到文件等操作。抓取的数据中包括了IP 报头、...

Global site tag (gtag.js) - Google Analytics