如何用易语言提取网页中的文本内容?

完整的网页文本,用 http读文件()有些文本提取不了,好像是一些用于请求的代码,比如 ${_UserData.nextLevelScore-_UserData.score} 之类的,在网页中的显示为数字... 谁知道如何提取完整的网页文本,或网页元素,解决这个问题!!

调用下面这个子程序就可以了实现你想要的功能了

.子程序 取指定内容, 文本型, , 取出想要的内容
.参数 完整内容, 文本型
.参数 左边文本, 文本型
.参数 右边文本, 文本型
.局部变量 临时位置, 整数型
.局部变量 总长度, 整数型
.局部变量 临时文本, 文本型

总长度 = 取文本长度 (完整内容)
临时位置 = 寻找文本 (完整内容, 左边文本, , 假) + 取文本长度 (左边文本)
临时文本 = 取文本中间 (完整内容, 临时位置, 总长度)
总长度 = 取文本长度 (临时文本)
临时位置 = 寻找文本 (临时文本, 右边文本, , 假) - 1
临时文本 = 取文本中间 (临时文本, 1, 临时位置)
返回 (临时文本)
温馨提示:答案为网友推荐,仅供参考
第1个回答  2012-05-28
给你看的例子,是在是一个播报北京时间的网页中,怎么样将其中的年月日提取出来的,也是通过分割文本,你看一下哈。
.版本 2
.支持库 internet

.程序集 窗口程序集1
.程序集变量 网页文本, 文本型
.程序集变量 临时文本, 文本型
.程序集变量 所需文本, 文本型, , "0"
.程序集变量 中间时间, 文本型, , "0"

.子程序 _按钮1_被单击

网页文本 = 到文本 (HTTP读文件 (“http://www.time.ac.cn/stime.asp”)) ' 这是国家授时中心网络服务器时间发布网站
所需文本 = 分割文本 (网页文本, “服务器时间:”, ) ' 将取回的文本分割,因为我们需要的网络时间在其后面
.如果真 (取数组成员数 (所需文本) < 2) ' 判断是否取回所需数据
信息框 (“取网络时间失败!链接网络不成功!”, 0 + #信息图标, “网络校时:”)
返回 ()
.如果真结束
临时文本 = 所需文本 [2]
所需文本 = 分割文本 (临时文本, “document.write('”, )
中间时间 = 分割文本 (所需文本 [3], “')”, )
编辑框1.内容 = 中间时间 [1] ' 取出年/月/日
临时文本 = 所需文本 [6]
所需文本 = 分割文本 (临时文本, “var hrs = ”, )
临时文本 = 所需文本 [2]
中间时间 = 分割文本 (临时文本, “;”, )
编辑框2.内容 = 中间时间 [1] ' 取出小时
所需文本 = 分割文本 (临时文本, “var min = ”, )
临时文本 = 所需文本 [2]
中间时间 = 分割文本 (临时文本, “;”, )
编辑框3.内容 = 中间时间 [1] ' 取出分钟
所需文本 = 分割文本 (临时文本, “var sec = ”, )
临时文本 = 所需文本 [2]
中间时间 = 分割文本 (临时文本, “;”, )
编辑框4.内容 = 中间时间 [1] ' 取出秒
第2个回答  2019-01-17
LZ可以用谷歌浏览器,在想要东西的页面游戏选择”审查元素“,然后看”resource“,所以资源都在里面。简单的方法还有是下载一个软件,貌似叫做”整站下载“。祝LZ好运。
第3个回答  推荐于2016-01-27
局部变量 返回文本文本型
返回文本=http读文本(A)
文本_取中间文本(返回文本,“
<label id="CardInfo" style="color:#1800ff; font-weight:bold;">”,“</label> ”)
第4个回答  2012-05-27
提取出来到 标签1.标题 中 应该怎么做( 如果 653831 这个数字不断变化的返回内容, 文本型位置1 = 寻找文本 (文本, “visitcount”, , 假) .,qRXZxk