抓取豆瓣fm华语频道音乐列表


Warning: WP_Syntax::substituteToken(): Argument #1 ($match) must be passed by reference, value given in /www/wwwroot/s5s5.me/wp-content/plugins/wp-syntax/wp-syntax.php on line 380

最近在学习Python,攻略说要多多练习才能学有成效,所以刚好非常喜欢听豆瓣FM的华语频道,有把里面的歌全下载下来的冲动,所以就拿他练手了,连学边写,果然学了不少东东,在此感谢搜索网站及QQ群,还有哪些乐于分享和讨论Python的人啊,不然我上哪模仿都不知道去哪啊,代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
# -*- coding:utf-8 -*-
# Filename : ex38.py
# https://s5s5.me
# 抓取豆瓣fm华语频道音乐列表
 
import os
import urllib
import json
import time
 
def get_music_json():
    # 抓取json并写入临时txt
    url = 'http://douban.fm/j/mine/playlist?type=n&channel=1'   # 定义json地址
    music_json = urllib.urlopen(url)    # urllib去抓json回来
    base_json = json.load(music_json)   # json把json解析
    output = open('tempfje_-83838399wfjefie.txt', 'a')  # 增量写入txt
    for i in base_json['song']:     # 找到json中的相关元素
        title = i['title'].encode('utf8')   # 写入txt用utf8码
        artist = i['artist'].encode('utf8')
        output.write(('%s\t%s' % (artist, title)) + '\n')   # 一行一首歌的写
    output.close()  # 关了文件
 
def no_repeat():
    # 对临时txt去重并排序
    read_txt = file('tempfje_-83838399wfjefie.txt', 'r')    # 读临时txt
    write_txt = file('songlist.txt', 'w')   # 要写入的txt
    s = set()   # 用set去重
    for i in read_txt:  # 把txt写到set过的变量中
        s.add(i)
    s = list(s)     # 先转成列表才能排序
    s.sort()        # 排序
    for i in s:     # 写入txt
        i = i.replace('/', '&')     # 替换/为&
        write_txt.write(i)
    os.remove('tempfje_-83838399wfjefie.txt')   # 删除临时txt
 
def main():
    for i in range(0, 100):   # 抓它100次,因为每条json只有10首歌左右
        get_music_json()
        print i     # 显示一下进度
        time.sleep(1)   # 延时1秒去抓,抓太快会被封IP
    no_repeat()     # 去重排序
    print '抓取豆瓣fm华语频道音乐列表完成'
 
main()

# -*- coding:utf-8 -*- # Filename : ex38.py # https://s5s5.me # 抓取豆瓣fm华语频道音乐列表 import os import urllib import json import time def get_music_json(): # 抓取json并写入临时txt url = 'http://douban.fm/j/mine/playlist?type=n&channel=1' # 定义json地址 music_json = urllib.urlopen(url) # urllib去抓json回来 base_json = json.load(music_json) # json把json解析 output = open('tempfje_-83838399wfjefie.txt', 'a') # 增量写入txt for i in base_json['song']: # 找到json中的相关元素 title = i['title'].encode('utf8') # 写入txt用utf8码 artist = i['artist'].encode('utf8') output.write(('%s\t%s' % (artist, title)) + '\n') # 一行一首歌的写 output.close() # 关了文件 def no_repeat(): # 对临时txt去重并排序 read_txt = file('tempfje_-83838399wfjefie.txt', 'r') # 读临时txt write_txt = file('songlist.txt', 'w') # 要写入的txt s = set() # 用set去重 for i in read_txt: # 把txt写到set过的变量中 s.add(i) s = list(s) # 先转成列表才能排序 s.sort() # 排序 for i in s: # 写入txt i = i.replace('/', '&') # 替换/为& write_txt.write(i) os.remove('tempfje_-83838399wfjefie.txt') # 删除临时txt def main(): for i in range(0, 100): # 抓它100次,因为每条json只有10首歌左右 get_music_json() print i # 显示一下进度 time.sleep(1) # 延时1秒去抓,抓太快会被封IP no_repeat() # 去重排序 print '抓取豆瓣fm华语频道音乐列表完成' main()

继续阅读“抓取豆瓣fm华语频道音乐列表”

Wubi离线安装Ubuntu

Wubi是一个从Windows下安装Ubuntu的小工具,用它安装Ubuntu如同在Win下安装了一个软件一样简单。
安装后在系统启动时会有选项问你进Win还是Ubuntu,原理有点像虚拟机,但又无需先起动Win,性能也如同直接安装。

但Wubi安装时非要自动BT下载Ubuntu,这样就非常不好了,因为我已经有Ubuntu的安装文件了,哪么怎么办呢,网上昨天转了好几圈找到的办法都比较复杂,最后去看他的 官方文档 ,原来只要断开网络,然后放在Wubi同一个目录下,然后Ubuntu的安装文件名是下载回来哪个名字,运行Wubi即能离线安装了。

当然Wubi也可以光盘安装,他的安装顺序是,有网络就从网络下当前系统合适的最新版,没网就找找光盘里有没有,没找到再来所在目录下找。

OVER

后布尔什维克时代

任何生产力都有为之匹配的生产关系,比如布尔什维克就是在羊吃人的形势下产生的。而当生产力发展到信息时代时,美国率先利用奥巴马做了信息代尝试。但在中国,在中国特色的布尔什维克时代,显然一切都显得这么的不和谐。当下看来只有两条路可走,一条是自下而上的一条是自上而下的,这两条路都有极端的做法,要么改朝换代要么暴力压制回到消息时代之前。但愿这两种极端都不要发生。

G+知道你是谁!

今天突然发现G+账号被审核了,原本以为是转了太多的18禁,所以被审核了。但又想到这之前为了凸显这个账号的神秘性把名字改了,所以又把名字改了回去,然后一下子就正常了,不审核了……好吧,Google你很牛,你已经全方位的定位了我是谁……突然间有点害怕!

Ubuntu的Python开发环境配置

最近学习Ubuntu和Python,人老了记性不好,在此记录一下

Ubuntu(vm环境):
1、Ubuntu.vmdk 下载:http://sourceforge.net/projects/happypenguin/files/ubuntu/vmdk/ (登陆密码:happypenguin.tw)
2、修改软件源至网易(Ubuntu软件中心 – 编辑 – 软件源)
3、修改至中文环境(系统设置 – 控制中心 – 语言支持)
4、装各种WIN上的字体……
继续阅读“Ubuntu的Python开发环境配置”

看了《我在赶集网的两个月》的有什么感想?

知乎的一个问题:看了《我在赶集网的两个月》的有什么感想?
我的回答如下:

虽然我也是IT业人士,但具体不知道赶集网和58他们是怎么运作的,所以看了这个文章第一反应是了解了不少的内幕,然后又为作者的激情所打动,觉得作者真是牛B人士啊。

不过,结合自己当年刚毕业在第一家公司上班的经历来看,我觉着可能咱们年青人是不是都有点太急于成功了,有点急功近利?(这也可能与当下的社会环境有关)我当年也是一开始进公司就感觉学了不少东西,自己有不少想法,老板也经常夸我,所以最后有点飘飘然,也感觉别人都不如我,打击我的人都认为我功高盖主了……其实呢?成功,这个词我们是不是还认识的有点太片面了,我们看到了太多太多的成功案例,却无视了更多失败案例?每个公司每个人都有不足,刚毕业的我们是不是只看到了别人的不足?不过,这也要工作几年后才会看到的吧……

最后,向作者学习,工作几年不能没了激情啊,当然也不能像作者一样无故旷工和大暴公司内幕啊,呵呵。

退出移动版