<%@ page contentType="text/html;charset=gb2312"%>
<%
String sCurrentLine;
String sTotalString;
sCurrentLine="";
sTotalString="";
String temp="";
java.io.InputStream l_urlStream;
for(int i=14;i<=22;i++){
java.net.URL l_url = new java.net.URL
("http://www.dltcedu.org/index_5/html/994"+i+".shtml");
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection)
l_url.openConnection();
l_connection.connect();
l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(new
java.io.InputStreamReader(l_urlStream));
int start=-1;
while ((sCurrentLine = l_reader.readLine()) != null)
{
if((start=sCurrentLine.indexOf("<div style=\"overflow:hidden"))!=-1){
temp=sCurrentLine.substring(start,sCurrentLine.length());
sTotalString+=temp.replaceAll("/UploadFile","http://www.dltcedu.org/UploadFile");
break;
}
//sTotalString+=sCurrentLine;
}
while ((sCurrentLine = l_reader.readLine()) != null)
{
if((start=sCurrentLine.indexOf("</P></p></div>"))!=-1){
temp=sCurrentLine.substring(0,(start+14));
sTotalString+=temp.replaceAll("/UploadFile","http://www.dltcedu.org/UploadFile");
break;
}
sTotalString+=sCurrentLine.replaceAll
("/UploadFile","http://www.dltcedu.org/UploadFile");;
}
}//for
out.println(sTotalString);
%>
分享到:
相关推荐
.NET 网页抓取例子(天气) .NET 网页抓取例子(天气)
自己写的一个网页抓取例子。抓取国家专利局的专利状态。
包含源代码及测试URL,抓取url.txt中的URL的内容,保存成txt
爬虫 抓取网页新闻例子 HtmlPage用法例子 java文件代码例子
<?xml version="1.0"?> <!--数据库连接字符串 --> ;database=Crawl;uid=sa;password=123456"/> <!-- 设置 compilation debug="true" 可将调试符号插入到 ...C# .Net 数据抓取 爬虫参考
今天介绍将HTML网页抓取下来,然后以PDF保存,废话不多说直接进入教程。 今天的例子以廖雪峰老师的Python教程网站为例:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000 二、...
这是由delphi xe10.1写的,里面都是中文变量,应该很容易看懂 我也是新手,在网上试着教程做,终于看懂了,于是自己简化和修改,让新的菜鸟们更容易上手理解。...内附程序演示以及源码分享,还有原始网页信息看代码
本文档包括在网上搜集的众多基于Python的网页抓取实例,包括代码及说明,不是原创,只是收集了一下 里面有些例子确实很不错,看了几个例子我尝试编写了个QQ空间日志备份程序,效果还不错 (详见资源: ...
是实现用htmlparser解析html,例子还有java解析xml。自己写的例子与大家分享!
导入Hbase的jar包即可直接返回Put对象数据、可以返回map对象数据、支持自定义json格式抓取指定网页的内容、抓取指定时间段内容、抓取指定关键内容、对新闻进行正负面分类、对时间的格式进行了统一的维护、可抓取指定...
很多朋友多问过我如何抓取网页的内容,其实并不难,但是对于网页的分析却不是很简单,以前我接触正则表达式比较少,就自己去分析页面,结果是要么抓到的数据不准,要么就根本抓不到。 现在写了两个类给朋友们用,...
这是一个使用jsoup抓取网页内容的例子,适合从事手机开发的初学者学习
这个小例子实现了抓取网站内容,获取网站内容,读取网站所有内容,抓取网页内容,获取网页内容,读取网页所有内容,得到上次访问URL,得到请求的URL,很不错的喔!!! 赶紧下啦。。
htmlparser实现从网页上抓取数据doc
采集网页的内容,这里主要是模拟抓取新浪微博中的内容,里面包括了[源码] 爬取客户端微博信息、[源码] 爬取移动端个人信息 关注id和粉丝id (速度慢)、[源码] 爬取移动端微博信息 (强推)等多个例子,关于运行本例子的...
虽然这个例子很有意思,却不够实用,因为爬虫在下载网页之后又将结果丢弃掉了。现在,我们需要让这个爬虫从每个网页中抽取一些数据,然后实现某些事情,这种做法也被称为抓取(scraping)。首先,我们会介绍一个叫做...
想实现用c++下载网页,这是个很好的例子
VB6.0演示如何抓取网络数据包,截获网络包的例子,原型是一个网络原始数据包嗅探器的修正版代码,程序基于winsock API,支持TCP,UDP和ICMP三种协议数据的抓取,支持记录到文件等操作。抓取的数据中包括了IP 报头、...