抓取豆瓣fm华语频道音乐列表
Warning: WP_Syntax::substituteToken(): Argument #1 ($match) must be passed by reference, value given in /www/wwwroot/s5s5.me/wp-content/plugins/wp-syntax/wp-syntax.php on line 380
最近在学习Python,攻略说要多多练习才能学有成效,所以刚好非常喜欢听豆瓣FM的华语频道,有把里面的歌全下载下来的冲动,所以就拿他练手了,连学边写,果然学了不少东东,在此感谢搜索网站及QQ群,还有哪些乐于分享和讨论Python的人啊,不然我上哪模仿都不知道去哪啊,代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 | # -*- coding:utf-8 -*- # Filename : ex38.py # https://s5s5.me # 抓取豆瓣fm华语频道音乐列表 import os import urllib import json import time def get_music_json(): # 抓取json并写入临时txt url = 'http://douban.fm/j/mine/playlist?type=n&channel=1' # 定义json地址 music_json = urllib.urlopen(url) # urllib去抓json回来 base_json = json.load(music_json) # json把json解析 output = open('tempfje_-83838399wfjefie.txt', 'a') # 增量写入txt for i in base_json['song']: # 找到json中的相关元素 title = i['title'].encode('utf8') # 写入txt用utf8码 artist = i['artist'].encode('utf8') output.write(('%s\t%s' % (artist, title)) + '\n') # 一行一首歌的写 output.close() # 关了文件 def no_repeat(): # 对临时txt去重并排序 read_txt = file('tempfje_-83838399wfjefie.txt', 'r') # 读临时txt write_txt = file('songlist.txt', 'w') # 要写入的txt s = set() # 用set去重 for i in read_txt: # 把txt写到set过的变量中 s.add(i) s = list(s) # 先转成列表才能排序 s.sort() # 排序 for i in s: # 写入txt i = i.replace('/', '&') # 替换/为& write_txt.write(i) os.remove('tempfje_-83838399wfjefie.txt') # 删除临时txt def main(): for i in range(0, 100): # 抓它100次,因为每条json只有10首歌左右 get_music_json() print i # 显示一下进度 time.sleep(1) # 延时1秒去抓,抓太快会被封IP no_repeat() # 去重排序 print '抓取豆瓣fm华语频道音乐列表完成' main() |
# -*- coding:utf-8 -*- # Filename : ex38.py # https://s5s5.me # 抓取豆瓣fm华语频道音乐列表 import os import urllib import json import time def get_music_json(): # 抓取json并写入临时txt url = 'http://douban.fm/j/mine/playlist?type=n&channel=1' # 定义json地址 music_json = urllib.urlopen(url) # urllib去抓json回来 base_json = json.load(music_json) # json把json解析 output = open('tempfje_-83838399wfjefie.txt', 'a') # 增量写入txt for i in base_json['song']: # 找到json中的相关元素 title = i['title'].encode('utf8') # 写入txt用utf8码 artist = i['artist'].encode('utf8') output.write(('%s\t%s' % (artist, title)) + '\n') # 一行一首歌的写 output.close() # 关了文件 def no_repeat(): # 对临时txt去重并排序 read_txt = file('tempfje_-83838399wfjefie.txt', 'r') # 读临时txt write_txt = file('songlist.txt', 'w') # 要写入的txt s = set() # 用set去重 for i in read_txt: # 把txt写到set过的变量中 s.add(i) s = list(s) # 先转成列表才能排序 s.sort() # 排序 for i in s: # 写入txt i = i.replace('/', '&') # 替换/为& write_txt.write(i) os.remove('tempfje_-83838399wfjefie.txt') # 删除临时txt def main(): for i in range(0, 100): # 抓它100次,因为每条json只有10首歌左右 get_music_json() print i # 显示一下进度 time.sleep(1) # 延时1秒去抓,抓太快会被封IP no_repeat() # 去重排序 print '抓取豆瓣fm华语频道音乐列表完成' main()
Wubi离线安装Ubuntu
Wubi是一个从Windows下安装Ubuntu的小工具,用它安装Ubuntu如同在Win下安装了一个软件一样简单。
安装后在系统启动时会有选项问你进Win还是Ubuntu,原理有点像虚拟机,但又无需先起动Win,性能也如同直接安装。
但Wubi安装时非要自动BT下载Ubuntu,这样就非常不好了,因为我已经有Ubuntu的安装文件了,哪么怎么办呢,网上昨天转了好几圈找到的办法都比较复杂,最后去看他的 官方文档 ,原来只要断开网络,然后放在Wubi同一个目录下,然后Ubuntu的安装文件名是下载回来哪个名字,运行Wubi即能离线安装了。
当然Wubi也可以光盘安装,他的安装顺序是,有网络就从网络下当前系统合适的最新版,没网就找找光盘里有没有,没找到再来所在目录下找。
OVER
在线调试并共享HTML,CSS,JS
如题,以后同人讲代码时可以用到
http://jsbin.com
http://jsfiddle.net/
后布尔什维克时代
任何生产力都有为之匹配的生产关系,比如布尔什维克就是在羊吃人的形势下产生的。而当生产力发展到信息时代时,美国率先利用奥巴马做了信息代尝试。但在中国,在中国特色的布尔什维克时代,显然一切都显得这么的不和谐。当下看来只有两条路可走,一条是自下而上的一条是自上而下的,这两条路都有极端的做法,要么改朝换代要么暴力压制回到消息时代之前。但愿这两种极端都不要发生。
读《三体》有感
剧透,慎入!
继续阅读“读《三体》有感”
G+知道你是谁!
今天突然发现G+账号被审核了,原本以为是转了太多的18禁,所以被审核了。但又想到这之前为了凸显这个账号的神秘性把名字改了,所以又把名字改了回去,然后一下子就正常了,不审核了……好吧,Google你很牛,你已经全方位的定位了我是谁……突然间有点害怕!
Ubuntu的Python开发环境配置
最近学习Ubuntu和Python,人老了记性不好,在此记录一下
Ubuntu(vm环境):
1、Ubuntu.vmdk 下载:http://sourceforge.net/projects/happypenguin/files/ubuntu/vmdk/ (登陆密码:happypenguin.tw)
2、修改软件源至网易(Ubuntu软件中心 – 编辑 – 软件源)
3、修改至中文环境(系统设置 – 控制中心 – 语言支持)
4、装各种WIN上的字体……
继续阅读“Ubuntu的Python开发环境配置”
听戴志康分享
看了《我在赶集网的两个月》的有什么感想?
知乎的一个问题:看了《我在赶集网的两个月》的有什么感想?
我的回答如下:
虽然我也是IT业人士,但具体不知道赶集网和58他们是怎么运作的,所以看了这个文章第一反应是了解了不少的内幕,然后又为作者的激情所打动,觉得作者真是牛B人士啊。
不过,结合自己当年刚毕业在第一家公司上班的经历来看,我觉着可能咱们年青人是不是都有点太急于成功了,有点急功近利?(这也可能与当下的社会环境有关)我当年也是一开始进公司就感觉学了不少东西,自己有不少想法,老板也经常夸我,所以最后有点飘飘然,也感觉别人都不如我,打击我的人都认为我功高盖主了……其实呢?成功,这个词我们是不是还认识的有点太片面了,我们看到了太多太多的成功案例,却无视了更多失败案例?每个公司每个人都有不足,刚毕业的我们是不是只看到了别人的不足?不过,这也要工作几年后才会看到的吧……
最后,向作者学习,工作几年不能没了激情啊,当然也不能像作者一样无故旷工和大暴公司内幕啊,呵呵。