做数据分析,没有数据,是分析师的硬伤。但不完全是硬伤,没有数据其实也可以利用逻辑思维能力来分析推断,这个以后有机会跟大家分享。今天,我要讲怎么用代码获取数据。
没办法很详细地讲,只能大致上讲解一下,然后给个实例。
工具:Excel2013(用哪个版本都是可以的)
语言:Visual Basic for Applications(简称VBA,集成在Office套件里面的开发程式,有些精简版或者用户在安装的时候取消了VBA套件,就会无法启动)
我原本学的是硬件开发,只会汇编,写这类程序不是我擅长的,而且是自学的只有半桶水的状态。我写的程序都有很大的优化空间,如果有更高效的方法,请不吝指教。
实例一:获取淘宝搜索结果页宝贝信息
如下图,搜索了关键词“T恤”后,会看到类似这样的结果,我想把宝贝标题和价格,排名位置等信息给抓取到本地数据库或者表格里面。
我们右击一下页面,点查看源文件
看到的结果如下
这个是网页源码,我要介绍的方法,就是通过网页请求,获取这里的源码,然后再对源码进行解析。
观察源码这个步骤很重要,在这里会决定数据要怎么拿。
比如要取出标题
标题是在 title= 后面的一串字符,又以 > 符号结束。把这两个看成是分隔符的话,那么标题就藏在两个分隔符的中间。
那么,思路上,只要知道这两个分割符的位置,那么,就可以取出标题了。