欢迎来到天天文库
浏览记录
ID:28282381
大小:118.04 KB
页数:6页
时间:2018-12-09
《利用httpurlconnection进行手机号段归属地数据采集》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、公司里需要手机号段归属地资料,手头上没有现成的数据,就自己做了个采集器,连到ip138.com网站上进行采集。这是最终运行界面: 首先在网页上输入至少7位的手机号码段进行查询,通过查看查询页面的HTML,发现将会提交两个参数:mobile=手机号码&action=mobile,然后对结果页面的HTML进行分析,找到关键的两行HTML:Html代码1.
2、" class=tdc2>广东 广州
3、段范围的循环提交请求,并将获取的数据写入文本文件。Java代码1.package com.funper.collector; 2. 3.import java.io.IOException; 4.import java.io.InputStreamReader; 5.import java.io.BufferedReader; 6.import java.net.HttpURLConnection; 7.import java.net.URL; 8.import java.util.regex
4、.Pattern; 9.import java.util.regex.Matcher; 1. 2./** 3. * 分析和采集数据 4. * 5. */ 6.public class CollectAction { 7. 8. //请求URL 9. private static final String REQUEST_URL="http://www.ip138.com:8080/search.asp"; 10. //请求方法 11. private sta
5、tic final String REQUEST_MOTHOD="POST"; 12. //提取手机号码归属地的正则表达式 13. private static final String REGEX_EXP="^
6、EX_EXP); 16. //连接URL的HttpURLConnection对象 17. private HttpURLConnection httpConn=null; 18. 19. /** 20. * 获取手机号码归属地 21. * @param requestParameter 提交参数 22. * @return String 23. */ 24. public String getMobileArea(String req
7、uestParameter) 25. { 26. String mobileArea=""; 27. BufferedReader br=null; 28. try 29. { 30. httpConn=(HttpURLConnection)new URL(REQUEST_URL).openConnection(); 31. httpConn.setRequestMethod(REQUES
8、T_MOTHOD); 32. httpConn.setDoOutput(true); 33. httpConn.getOutputStream().write(requestParameter.getBytes()); 34. httpConn.getOutputStream().flush(); 35. httpCo
此文档下载收益归作者所有