JDK中URLConnection使用详解
本打算自己写一篇博客记录Java中URLConnection的使用,网上搜索了一番,发现这篇JDK中的URLConnection参数详解写得很好了,转载该文如下。
针对JDK中的URLConnection连接Servlet的问题,网上虽然有所涉及,但是只是说明了某一个或几个问题,是以FAQ的方式来解决的,而且比较零散,现在对这个类的使用就本人在项目中的使用经验做如下总结。
URL请求的类别
URL请求分为两类:GET与POST请求。二者的区别在于:
- get请求可以获取静态页面,也可以把参数放在URL字串后面,传递给servlet
- post与get的不同之处在于post的参数不是放在URL字串里面,而是放在http请求的正文内
创建URLConnection对象
Java中可以使用HttpURLConnection来请求WEB资源。
HttpURLConnection对象不能直接构造,需要通过URL.openConnection()
来获得HttpURLConnection对象,示例代码如下:
1 | String urlStr = "http://www.your-website.com"; |
HTTPURLConnection对象参数问题
1 | //设置是否向httpUrlConnection输出,因为这个是post请求,参数要放在 |
HttpURLConnection是基于HTTP协议的,其底层通过socket通信实现。如果不设置超时(timeout),在网络异常的情况下,可能会导致程序僵死而不继续往下执行。可以通过以下两个语句来设置相应的超时:
1 | System.setProperty("sun.net.client.defaultConnectTimeout", 超时毫秒数字符串); |
其中:
sun.net.client.defaultConnectTimeout
:连接主机的超时时间(单位:毫秒)
sun.net.client.defaultReadTimeout
:从主机读取数据的超时时间(单位:毫秒)
例如:
1 | System.setProperty("sun.net.client.defaultConnectTimeout", "30000"); |
JDK 1.5以前的版本,只能通过设置这两个系统属性来控制网络超时。在1.5中,还可以使用HttpURLConnection的父类URLConnection的以下两个方法:
setConnectTimeout
: 设置连接主机超时(单位:毫秒)
setReadTimeout
: 设置从主机读取数据超时(单位:毫秒)
例如:
1 | HttpURLConnection urlCon = (HttpURLConnection)url.openConnection(); |
需要注意的是,笔者在JDK1.4.2环境下,发现在设置了defaultReadTimeout的情况下,如果发生网络超时,HttpURLConnection会自动重新提交一次请求,出现一次请求调用,请求服务器两次的问题(Trouble)。我认为这是JDK1.4.2的一个bug。在JDK1.5.0中,此问题已得到解决,不存在自动重发现象。
HttpURLConnection连接问题
1 | //建立连接,从上述url.openConnection()至此的配置必须要在connect之前完成, |
HttpURLConnection写数据与发送数据问题
1 | //现在通过输出流对象构建对象输出流对象,以实现输出可序列化的对象 |
HttpURLConnection使用总结
- HttpURLConnection的
connect()
函数,实际上只是建立了一个与服务器的tcp连接,并没有实际发送http请求。无论是post还是get,http请求实际上直到HttpURLConnection的getInputStream()
这个函数里面才正式发送出去。 - 在用POST方式发送URL请求时,URL请求参数的设定顺序是重中之重:
对connection对象的一切配置(那一堆set函数)都必须要在connect()
函数执行之前完成。
对outputStream的写操作,又必须要在inputStream的读操作之前。
这些顺序实际上是由http请求的格式决定的。如果inputStream读操作在outputStream的写操作之前,会抛出例外:
java.net.ProtocolException: Cannot write output after reading input......
- http请求实际上由两部分组成,一个是http头,所有关于此次http请求的配置都在http头里面定义;一个是正文content。
connect()
函数会根据HttpURLConnection对象的配置值生成http头部信息,因此在调用connect函数之前,就必须把所有的配置准备好。 - 在http头后面紧跟着的是http请求的正文,正文的内容是通过outputStream流写入的,实际上outputStream不是一个网络流,充其量是个字符串流,往里面写入的东西不会立即发送到网络,而是存在于内存缓冲区中,待outputStream流关闭时,根据输入的内容生成http正文。至此,http请求的东西已经全部准备就绪。在
getInputStream()
函数调用的时候,就会把准备好的http请求正式发送到服务器了,然后返回一个输入流,用于读取服务器对于此次http请求的返回信息。由于http请求在getInputStream的时候已经发送出去了(包括http头和正文),因此在getInputStream()
函数之后对connection对象进行设置(对http头的信息进行修改)或者写入outputStream(对正文进行修改)都是没有意义的了,执行这些操作会导致异常的发生。
Servlet端的开发注意点
- 对于客户端发送的
POST
类型的HTTP
请求,Servlet
必须实现doPost
方法,而不能用doGet
方法。 - 用
HttpServletRequest
的getInputStream()
方法取得InputStream
的对象,比如:
InputStream inStream = httpRequest.getInputStream();
现在调用inStream.available()
(该方法用于“返回此输入流下一个方法调用可以不受阻塞地从此输入流读取(或跳过)的估计字节数”)时,永远都返回0。试图使用此方法的返回值分配缓冲区,以保存此流所有数据的做法是不正确的。那么,现在的解决办法是Servlet
这一端用如下实现:
1 | InputStream inStream = httpRequest.getInputStream(); |
而客户端,无论是否发送实际数据都要写入一个对象,如:
1 | ObjectOutputStream objOutputStrm = new ObjectOutputStream(outStrm); |
注意:上述在创建对象输出流ObjectOutputStream
时,如果将从HttpServletRequest
取得的输入流(即:new ObjectOutputStream(outStrm)
中的outStrm
)包装在BufferedOutputStream流里面, 则必须有objOutputStrm.flush()
;这一句,以便将流信息刷入缓冲输出流.如下:
1 | ObjectOutputStream objOutputStrm = new ObjectOutputStream(new BufferedOutputStream(outStrm)); |