splash的使用之一render.html

splash的使用之一render.html

返回JavaScript呈现页面的HTML.

参数:

url:string:必需
# 要渲染的网址
baseurl:string:可选
# 用于呈现页面的基本URL,基本html内容将从url参数获取,
而用于呈现页面的HTML文本中的相对引用源是使用baseurl
参数中给出的url作为基础获取的.
timeout:float:可选
# 渲染的超时(以秒为单位),默认为30.
# 默认情况下,可以设置的最大值为90,如果要覆盖需要在容器
启动时使用--max-timeout命令,可以允许最大300.
resource_timeout:float:可选
# 单个网络请求的超时(以秒为单位)
wait:float:可选
# 加载页面后等待时间(以秒为单位),默认为0.等0时不会执行
setInterval/setTimeout的回调,另外全面渲染时,PNG和JPEG
也需要非零等待,但要注意该时间必须小于超时.
proxy:string:可选
# 代理配置文件名称或代理URL.
# 格式 [protocol://][user:[email protected]]proxyhost[:port] ,
协议是http/socks5,默认端口1080.
js:string:可选
# JavaScript个人资料名称.
js_source:string:可选
# 要在页面上下文中执行的JavaScript代码.
filters:string:可选
# 以逗号分隔的请求过滤器名称列表.
allowed_domains:string:可选
# 以逗号分隔的允许域名列表.如果存在,splash将仅从列表中
加载内容,包括子域.
allowed_content_types:string:可选
# 以逗号分隔的允许内容类型列表.如果存在,splash将仅响应
次列表中的类型.
forbidden_content_types:string:可选
# 以逗号分隔禁止内容类型列表.如果存在,splash将拒绝响
应列表中的类型.
viewport:string:可选
# 查看浏览器视口的宽度和高度(像素为单位)以呈现网页.
# 格式 × ,默认值800×600.
# 该参数对于PNG和JPEG渲染很重要,因为js代码的渲染很可
能取决于视口大小.
# 可以接受值为"full",等同于render_all=1.
images:integer:可选
# 是否下载图像.1为下载,0为不下载.默认为1.
headers:json数组或对象:可选
# 要为第一个传出请求设置的http标头.
# 仅支持application/json POST请求.值可以是json数组,
也可以是带有标题名的json对象,标题值作为值.(header_name,header_value)
# "User-Agent"标头是特殊的,用于所有传出请求,与其他标头不同.
body:string:可选
# 如果方法是POST,则发送HTTP POST请求的主体.content-type POST
请求的默认标头是 application/x-www-form-urlencoded.
http_method:string:可选
传出splash请求的HTTP方法.默认是GET,也支持POST.
save_args:json数组或以逗
号分隔的字符串:可选
# 要放入缓存的参数名称列表.splash会将每个参数值存储在内部缓
存中,并返回X-Splash-Saved-Arguments HTTP标头,其中包含每
个参数的SHA1哈希列表.
# 客户端可以使用load_args参数传递.
# 当数值很大且不易更改时,可以使用js_source或lua_source.
load_args:json对象或字符串:可选
# 从缓存加载的参数值.是json对象或原始标头值(以分号分隔的名称)
html5_media:integer:可选
# 是否启用HTML5媒体.1为启用,0为禁用.默认为0.

示例:

curl 'http://localhost:8050/render.html?
url=http://domain.com/page-with-javascript.html&
timeout=10&wait=0.5'

结果始终编码为utf-8,即时如下这样:

主要参考链接:splash DOC

ddzzhen

发表评论