数据抓取:

Beautifulsoup简介


王成军

[email protected]

计算传播网 http://computational-communication.com

需要解决的问题

  • 页面解析
  • 获取Javascript隐藏源数据
  • 自动翻页
  • 自动登录
  • 连接API接口
In [2]:
import urllib2
from bs4 import BeautifulSoup

Beautiful Soup

Beautiful Soup is a Python library designed for quick turnaround projects like screen-scraping. Three features make it powerful:

  • Beautiful Soup provides a few simple methods. It doesn't take much code to write an application
  • Beautiful Soup automatically converts incoming documents to Unicode and outgoing documents to UTF-8. Then you just have to specify the original encoding.
  • Beautiful Soup sits on top of popular Python parsers like lxml and html5lib.

Install beautifulsoup4

open your terminal/cmd

$ pip install beautifulsoup4

第一个爬虫

Beautifulsoup Quick Start

http://www.crummy.com/software/BeautifulSoup/bs4/doc/

In [51]:
url = 'file:///Users/chengjun/GitHub/cjc2016/data/test.html'
# http://computational-class.github.io/cjc2016/data/test.html
content = urllib2.urlopen(url).read() 
soup = BeautifulSoup(content, 'html.parser') 
soup
Out[51]:
<html><head><title>The Dormouse's story</title></head>\n<body>\n<p class="title"><b>The Dormouse's story</b></p>\n<p class="story">Once upon a time there were three little sisters; and their names were\n<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,\n<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and\n<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>\n<p class="story">...</p></body></html>

html.parser

Beautiful Soup supports the html.parser included in Python’s standard library

lxml

but it also supports a number of third-party Python parsers. One is the lxml parser lxml. Depending on your setup, you might install lxml with one of these commands:

$ apt-get install python-lxml

$ easy_install lxml

$ pip install lxml

html5lib

Another alternative is the pure-Python html5lib parser html5lib, which parses HTML the way a web browser does. Depending on your setup, you might install html5lib with one of these commands:

$ apt-get install python-html5lib

$ easy_install html5lib

$ pip install html5lib

In [52]:
print(soup.prettify())
<html>
 <head>
  <title>
   The Dormouse's story
  </title>
 </head>
 <body>
  <p class="title">
   <b>
    The Dormouse's story
   </b>
  </p>
  <p class="story">
   Once upon a time there were three little sisters; and their names were
   <a class="sister" href="http://example.com/elsie" id="link1">
    Elsie
   </a>
   ,
   <a class="sister" href="http://example.com/lacie" id="link2">
    Lacie
   </a>
   and
   <a class="sister" href="http://example.com/tillie" id="link3">
    Tillie
   </a>
   ;
and they lived at the bottom of a well.
  </p>
  <p class="story">
   ...
  </p>
 </body>
</html>
  • html
    • head
      • title
    • body
      • p (class = 'title', 'story' )
        • a (class = 'sister')
          • href/id

Select 方法

In [69]:
soup.select('.sister')
Out[69]:
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
 <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
 <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
In [68]:
soup.select('.story')
Out[68]:
[<p class="story">Once upon a time there were three little sisters; and their names were\n<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,\n<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and\n<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>,
 <p class="story">...</p>]
In [57]:
soup.select('#link2')
Out[57]:
[<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]
In [67]:
soup.select('#link2')[0]['href']
Out[67]:
u'http://example.com/lacie'

find_all方法

In [4]:
soup('p')
Out[4]:
[<p class="title"><b>The Dormouse's story</b></p>,
 <p class="story">Once upon a time there were three little sisters; and their names were\n<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,\n<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and\n<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>,
 <p class="story">...</p>]
In [5]:
soup.find_all('p')
Out[5]:
[<p class="title"><b>The Dormouse's story</b></p>,
 <p class="story">Once upon a time there were three little sisters; and their names were\n<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,\n<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and\n<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>,
 <p class="story">...</p>]
In [10]:
[i.text for i in soup('p')]
Out[10]:
[u"The Dormouse's story",
 u'Once upon a time there were three little sisters; and their names were\nElsie,\nLacie and\nTillie;\nand they lived at the bottom of a well.',
 u'...']
In [11]:
for i in soup('p'):
    print i.text
The Dormouse's story
Once upon a time there were three little sisters; and their names were
Elsie,
Lacie and
Tillie;
and they lived at the bottom of a well.
...
In [72]:
for tag in soup.find_all(True):
    print(tag.name)
html
head
title
body
p
b
p
a
a
a
p
In [58]:
soup('head') # or soup.head
Out[58]:
[<head><title>The Dormouse's story</title></head>]
In [59]:
soup('body') # or soup.body
Out[59]:
[<body>\n<p class="title"><b>The Dormouse's story</b></p>\n<p class="story">Once upon a time there were three little sisters; and their names were\n<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,\n<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and\n<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>\n<p class="story">...</p></body>]
In [29]:
soup('title')  # or  soup.title
Out[29]:
[<title>The Dormouse's story</title>]
In [60]:
soup('p')
Out[60]:
[<p class="title"><b>The Dormouse's story</b></p>,
 <p class="story">Once upon a time there were three little sisters; and their names were\n<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,\n<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and\n<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>,
 <p class="story">...</p>]
In [62]:
soup.p
Out[62]:
<p class="title"><b>The Dormouse's story</b></p>
In [30]:
soup.title.name
Out[30]:
u'title'
In [31]:
soup.title.string
Out[31]:
u"The Dormouse's story"
In [48]:
soup.title.text
# 推荐使用text方法
Out[48]:
u"The Dormouse's story"
In [32]:
soup.title.parent.name
Out[32]:
u'head'
In [33]:
soup.p
Out[33]:
<p class="title"><b>The Dormouse's story</b></p>
In [34]:
soup.p['class']
Out[34]:
[u'title']
In [50]:
soup.find_all('p', {'class', 'title'})
Out[50]:
[<p class="title"><b>The Dormouse's story</b></p>]
In [78]:
soup.find_all('p', class_= 'title')
Out[78]:
[<p class="title"><b>The Dormouse's story</b></p>]
In [49]:
soup.find_all('p', {'class', 'story'})
Out[49]:
[<p class="story">Once upon a time there were three little sisters; and their names were\n<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,\n<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a> and\n<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>;\nand they lived at the bottom of a well.</p>,
 <p class="story">...</p>]
In [57]:
soup.find_all('p', {'class', 'story'})[0].find_all('a')
Out[57]:
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
 <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
 <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
In [35]:
soup.a
Out[35]:
<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>
In [79]:
soup('a')
Out[79]:
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
 <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
 <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
In [37]:
soup.find(id="link3")
Out[37]:
<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>
In [36]:
soup.find_all('a')
Out[36]:
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
 <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
 <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
In [80]:
soup.find_all('a', {'class', 'sister'}) # compare with soup.find_all('a')
Out[80]:
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
 <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
 <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
In [81]:
soup.find_all('a', {'class', 'sister'})[0]
Out[81]:
<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>
In [44]:
soup.find_all('a', {'class', 'sister'})[0].text
Out[44]:
u'Elsie'
In [46]:
soup.find_all('a', {'class', 'sister'})[0]['href']
Out[46]:
u'http://example.com/elsie'
In [47]:
soup.find_all('a', {'class', 'sister'})[0]['id']
Out[47]:
u'link1'
In [71]:
soup.find_all(["a", "b"])
Out[71]:
[<b>The Dormouse's story</b>,
 <a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
 <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
 <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
In [38]:
print(soup.get_text())
The Dormouse's story

The Dormouse's story
Once upon a time there were three little sisters; and their names were
Elsie,
Lacie and
Tillie;
and they lived at the bottom of a well.
...


数据抓取:

根据URL抓取微信公众号文章内容



王成军

[email protected]

计算传播网 http://computational-communication.com

In [11]:
from IPython.display import display_html, HTML
HTML('<iframe src=http://mp.weixin.qq.com/s?__biz=MzA3MjQ5MTE3OA==&\
mid=206241627&idx=1&sn=471e59c6cf7c8dae452245dbea22c8f3&3rd=MzA3MDU4NTYzMw==&scene=6#rd\
width=500 height=500></iframe>')
# the webpage we would like to crawl
Out[11]:

查看源代码

Inspect

In [38]:
url = "http://mp.weixin.qq.com/s?__biz=MzA3MjQ5MTE3OA==&\
mid=206241627&idx=1&sn=471e59c6cf7c8dae452245dbea22c8f3&3rd=MzA3MDU4NTYzMw==&scene=6#rd"
content = urllib2.urlopen(url).read() #获取网页的html文本
soup = BeautifulSoup(content, 'html.parser') 
In [46]:
title = soup.select("div .title #id1 img ")
for i in title:
    print i.text
点击上方“微议题排行榜”可以订阅哦!
点击上方“微议题排行榜”可以订阅哦!

点击上方“微议题排行榜”可以订阅哦!
点击上方“微议题排行榜”可以订阅哦!
点击上方“微议题排行榜”可以订阅哦!
“微议题排行榜”
导读2015年4月25日,尼泊尔发生8.1级地震,造成至少7000多人死亡,中国西藏、印度、孟加拉国、不丹等地均出现人员伤亡。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。
导读2015年4月25日,尼泊尔发生8.1级地震,造成至少7000多人死亡,中国西藏、印度、孟加拉国、不丹等地均出现人员伤亡。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。
导读
导读
2015年4月25日,尼泊尔发生8.1级地震,造成至少7000多人死亡,中国西藏、印度、孟加拉国、不丹等地均出现人员伤亡。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。
2015年4月25日,尼泊尔发生8.1级地震,造成至少7000多人死亡,中国西藏、印度、孟加拉国、不丹等地均出现人员伤亡。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。
2015年4月25日,尼泊尔发生8.1级地震,造成至少7000多人死亡,中国西藏、印度、孟加拉国、不丹等地均出现人员伤亡。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。


我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。


  热词图现 
  






热词图现
热词图现
 






本文以“地震”为关键词,选取了2015年4月10日至4月30日期间微议题TOP100阅读排行进行分析。根据微议题TOP100标题的词频统计,我们可以看出有关“地震”的话题最热词汇的有“尼泊尔”、“油价”、“发改委”。4月25日尼泊尔发生了8级地震,深受人们的关注。面对国外灾难性事件,微媒体的重心却转向“油价”、“发改委”、“祖国先撤”,致力于将世界重大事件与中国政府关联起来。


本文以“地震”为关键词,选取了2015年4月10日至4月30日期间微议题TOP100阅读排行进行分析。根据微议题TOP100标题的词频统计,我们可以看出有关“地震”的话题最热词汇的有“尼泊尔”、“油价”、“发改委”。4月25日尼泊尔发生了8级地震,深受人们的关注。面对国外灾难性事件,微媒体的重心却转向“油价”、“发改委”、“祖国先撤”,致力于将世界重大事件与中国政府关联起来。


  微议题演化趋势 
  






微议题演化趋势
微议题演化趋势
 




总文章数
总文章数


总阅读数
总阅读数


从4月10日到4月30日,有关“地震”议题出现三个峰值,分别是在4月15日内蒙古地震,20日台湾地震和25日尼泊尔地震。其中对台湾地震与内蒙古地震报道文章较少,而对尼泊尔地震却给予了极大的关注,无论是在文章量还是阅读量上都空前增多。内蒙古、台湾地震由于级数较小,关注少,议程时间也比较短,一般3天后就会淡出公共视野。而尼泊尔地震虽然接近性较差,但规模大,且衍生话题性较强,其讨论热度持续了一周以上。
从4月10日到4月30日,有关“地震”议题出现三个峰值,分别是在4月15日内蒙古地震,20日台湾地震和25日尼泊尔地震。其中对台湾地震与内蒙古地震报道文章较少,而对尼泊尔地震却给予了极大的关注,无论是在文章量还是阅读量上都空前增多。内蒙古、台湾地震由于级数较小,关注少,议程时间也比较短,一般3天后就会淡出公共视野。而尼泊尔地震虽然接近性较差,但规模大,且衍生话题性较强,其讨论热度持续了一周以上。


  议题分类 
  






议题分类
议题分类
 






如图,我们将此议题分为6大类。


如图,我们将此议题分为6大类。


1尼泊尔地震
1尼泊尔地震
1
1
尼泊尔地震
尼泊尔地震
尼泊尔地震
这类文章是对4月25日尼泊尔地震的新闻报道,包括现场视频,地震强度、规模,损失程度、遇难人员介绍等。更进一步的,有对尼泊尔地震原因探析,认为其处在板块交界处,灾难是必然的。因尼泊尔是佛教圣地,也有从佛学角度解释地震的启示。
这类文章是对4月25日尼泊尔地震的新闻报道,包括现场视频,地震强度、规模,损失程度、遇难人员介绍等。更进一步的,有对尼泊尔地震原因探析,认为其处在板块交界处,灾难是必然的。因尼泊尔是佛教圣地,也有从佛学角度解释地震的启示。


2国内地震报道
2国内地震报道
2
2
国内地震报道
国内地震报道
国内地震报道
主要是对10日内蒙古、甘肃、山西等地的地震,以及20日台湾地震的报道。偏重于对硬新闻的呈现,介绍地震范围、级数、伤亡情况,少数几篇是对甘肃地震的辟谣,称其只是微震。
主要是对10日内蒙古、甘肃、山西等地的地震,以及20日台湾地震的报道。偏重于对硬新闻的呈现,介绍地震范围、级数、伤亡情况,少数几篇是对甘肃地震的辟谣,称其只是微震。


3中国救援回应
3中国救援回应
3
3
中国救援回应
中国救援回应
中国救援回应
地震救援的报道大多是与尼泊尔地震相关,并且80%的文章是中国政府做出迅速反应派出救援机接国人回家。以“中国人又先撤了”,来为祖国点赞。少数几篇是滴滴快的、腾讯基金、万达等为尼泊尔捐款的消息。
地震救援的报道大多是与尼泊尔地震相关,并且80%的文章是中国政府做出迅速反应派出救援机接国人回家。以“中国人又先撤了”,来为祖国点赞。少数几篇是滴滴快的、腾讯基金、万达等为尼泊尔捐款的消息。


4发改委与地震
4发改委与地震
4
4
发改委与地震
发改委与地震
发改委与地震
这类文章内容相似,纯粹是对发改委的调侃。称其“预测”地震非常准确,只要一上调油价,便会发生地震。
这类文章内容相似,纯粹是对发改委的调侃。称其“预测”地震非常准确,只要一上调油价,便会发生地震。


5地震常识介绍
5地震常识介绍
5
5
地震常识介绍
地震常识介绍
地震常识介绍
该类文章介绍全国地震带、地震频发地,地震逃生注意事项,“专家传受活命三角”,如何用手机自救等小常识。
该类文章介绍全国地震带、地震频发地,地震逃生注意事项,“专家传受活命三角”,如何用手机自救等小常识。


6地震中的故事
6地震中的故事
6
6
地震中的故事
地震中的故事
地震中的故事
讲述地震中的感人瞬间,回忆汶川地震中的故事,传递“:地震无情,人间有情”的正能量。
讲述地震中的感人瞬间,回忆汶川地震中的故事,传递“:地震无情,人间有情”的正能量。







 国内外地震关注差异大
 国内外地震关注差异大
 
 
国内外地震关注差异大
国内外地震关注差异大
关于“地震”本身的报道仍旧是媒体关注的重点,尼泊尔地震与国内地震报道占一半的比例。而关于尼泊尔话题的占了45%,国内地震相关的只有22%。微媒体对国内外地震关注有明显的偏差,而且在衍生话题方面也相差甚大。尼泊尔地震中,除了硬新闻报道外,还有对其原因分析、中国救援情况等,而国内地震只是集中于硬新闻。地震常识介绍只占9%,地震知识普及还比较欠缺。
关于“地震”本身的报道仍旧是媒体关注的重点,尼泊尔地震与国内地震报道占一半的比例。而关于尼泊尔话题的占了45%,国内地震相关的只有22%。微媒体对国内外地震关注有明显的偏差,而且在衍生话题方面也相差甚大。尼泊尔地震中,除了硬新闻报道外,还有对其原因分析、中国救援情况等,而国内地震只是集中于硬新闻。地震常识介绍只占9%,地震知识普及还比较欠缺。


  阅读与点赞分析 
  






阅读与点赞分析
阅读与点赞分析
 














 爱国新闻容易激起点赞狂潮
 爱国新闻容易激起点赞狂潮
 
 
爱国新闻容易激起点赞狂潮
爱国新闻容易激起点赞狂潮
整体上来说,网民对地震议题关注度较高,自然灾害类话题一旦爆发,很容易引起人们情感共鸣,掀起热潮。但从点赞数来看,“中国救援回应”类的总点赞与平均点赞都是最高的,网民对地震的关注点并非地震本身,而是与之相关的“政府行动”。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。而爱国新闻则往往是最容易煽动民族情绪,产生民族优越感,激起点赞狂潮。
整体上来说,网民对地震议题关注度较高,自然灾害类话题一旦爆发,很容易引起人们情感共鸣,掀起热潮。但从点赞数来看,“中国救援回应”类的总点赞与平均点赞都是最高的,网民对地震的关注点并非地震本身,而是与之相关的“政府行动”。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。而爱国新闻则往往是最容易煽动民族情绪,产生民族优越感,激起点赞狂潮。


 人的关注小于国民尊严的保护
 人的关注小于国民尊严的保护
 
 
人的关注小于国民尊严的保护
人的关注小于国民尊严的保护
另一方面,国内地震的关注度却很少,不仅体现在政府救援的报道量小,网民的兴趣点与评价也较低。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。“发改委与地震”的点赞量也相对较高,网民对发改委和地震的调侃,反映出的是对油价上涨的不满,这种“怨气”也容易产生共鸣。一面是民族优越感,一面是对政策不满,两种情绪虽矛盾,但同时体现了网民心理趋同。
另一方面,国内地震的关注度却很少,不仅体现在政府救援的报道量小,网民的兴趣点与评价也较低。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。“发改委与地震”的点赞量也相对较高,网民对发改委和地震的调侃,反映出的是对油价上涨的不满,这种“怨气”也容易产生共鸣。一面是民族优越感,一面是对政策不满,两种情绪虽矛盾,但同时体现了网民心理趋同。


  数据附表 
  






数据附表
数据附表
 




微文章排行TOP50:
微文章排行TOP50:


公众号排行TOP20:
公众号排行TOP20:





作者:晏雪菲
作者:晏雪菲
作者:晏雪菲



出品单位:南京大学计算传播学实验中心技术支持:南京大学谷尼舆情监测分析实验室题图鸣谢:谷尼舆情新微榜、图悦词云
出品单位:南京大学计算传播学实验中心技术支持:南京大学谷尼舆情监测分析实验室题图鸣谢:谷尼舆情新微榜、图悦词云




出品单位:南京大学计算传播学实验中心技术支持:南京大学谷尼舆情监测分析实验室题图鸣谢:谷尼舆情新微榜、图悦词云
出品单位:南京大学计算传播学实验中心

技术支持:南京大学谷尼舆情监测分析实验室

题图鸣谢:谷尼舆情新微榜、图悦词云



In [17]:
print soup.find('h2', {'class', 'rich_media_title'}).text
南大新传 | 微议题:地震中民族自豪—“中国人先撤”
In [20]:
print soup.find('div', {'class', 'rich_media_meta_list'})
<div class="rich_media_meta_list">
<em class="rich_media_meta rich_media_meta_text" id="post-date">2015-05-04</em>
<em class="rich_media_meta rich_media_meta_text">南大新传院</em>
<a class="rich_media_meta rich_media_meta_link rich_media_meta_nickname" href="javascript:void(0);" id="post-user">微议题排行榜</a>
<span class="rich_media_meta rich_media_meta_text rich_media_meta_nickname">微议题排行榜</span>
<div class="profile_container" id="js_profile_qrcode" style="display:none;">
<div class="profile_inner">
<strong class="profile_nickname">微议题排行榜</strong>
<img alt="" class="profile_avatar" id="js_profile_qrcode_img" src="">
<p class="profile_meta">
<label class="profile_meta_label">微信号</label>
<span class="profile_meta_value">IssuesRank</span>
</p>
<p class="profile_meta">
<label class="profile_meta_label">功能介绍</label>
<span class="profile_meta_value">感谢关注《微议题排行榜》。我们是南京大学新闻传播学院,计算传播学实验中心,致力于研究社会化媒体时代的公共议程,发布新媒体平台的议题排行榜。</span>
</p>
</img></div>
<span class="profile_arrow_wrp" id="js_profile_arrow_wrp">
<i class="profile_arrow arrow_out"></i>
<i class="profile_arrow arrow_in"></i>
</span>
</div>
</div>
In [23]:
print soup.find('em').text
2015-05-04
In [29]:
article = soup.find('div', {'class' , 'rich_media_content'}).text
print article
点击上方“微议题排行榜”可以订阅哦!导读2015年4月25日,尼泊尔发生8.1级地震,造成至少7000多人死亡,中国西藏、印度、孟加拉国、不丹等地均出现人员伤亡。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。  热词图现 本文以“地震”为关键词,选取了2015年4月10日至4月30日期间微议题TOP100阅读排行进行分析。根据微议题TOP100标题的词频统计,我们可以看出有关“地震”的话题最热词汇的有“尼泊尔”、“油价”、“发改委”。4月25日尼泊尔发生了8级地震,深受人们的关注。面对国外灾难性事件,微媒体的重心却转向“油价”、“发改委”、“祖国先撤”,致力于将世界重大事件与中国政府关联起来。  微议题演化趋势 总文章数总阅读数从4月10日到4月30日,有关“地震”议题出现三个峰值,分别是在4月15日内蒙古地震,20日台湾地震和25日尼泊尔地震。其中对台湾地震与内蒙古地震报道文章较少,而对尼泊尔地震却给予了极大的关注,无论是在文章量还是阅读量上都空前增多。内蒙古、台湾地震由于级数较小,关注少,议程时间也比较短,一般3天后就会淡出公共视野。而尼泊尔地震虽然接近性较差,但规模大,且衍生话题性较强,其讨论热度持续了一周以上。  议题分类 如图,我们将此议题分为6大类。1尼泊尔地震这类文章是对4月25日尼泊尔地震的新闻报道,包括现场视频,地震强度、规模,损失程度、遇难人员介绍等。更进一步的,有对尼泊尔地震原因探析,认为其处在板块交界处,灾难是必然的。因尼泊尔是佛教圣地,也有从佛学角度解释地震的启示。2国内地震报道主要是对10日内蒙古、甘肃、山西等地的地震,以及20日台湾地震的报道。偏重于对硬新闻的呈现,介绍地震范围、级数、伤亡情况,少数几篇是对甘肃地震的辟谣,称其只是微震。3中国救援回应地震救援的报道大多是与尼泊尔地震相关,并且80%的文章是中国政府做出迅速反应派出救援机接国人回家。以“中国人又先撤了”,来为祖国点赞。少数几篇是滴滴快的、腾讯基金、万达等为尼泊尔捐款的消息。4发改委与地震这类文章内容相似,纯粹是对发改委的调侃。称其“预测”地震非常准确,只要一上调油价,便会发生地震。5地震常识介绍该类文章介绍全国地震带、地震频发地,地震逃生注意事项,“专家传受活命三角”,如何用手机自救等小常识。6地震中的故事讲述地震中的感人瞬间,回忆汶川地震中的故事,传递“:地震无情,人间有情”的正能量。 国内外地震关注差异大关于“地震”本身的报道仍旧是媒体关注的重点,尼泊尔地震与国内地震报道占一半的比例。而关于尼泊尔话题的占了45%,国内地震相关的只有22%。微媒体对国内外地震关注有明显的偏差,而且在衍生话题方面也相差甚大。尼泊尔地震中,除了硬新闻报道外,还有对其原因分析、中国救援情况等,而国内地震只是集中于硬新闻。地震常识介绍只占9%,地震知识普及还比较欠缺。  阅读与点赞分析  爱国新闻容易激起点赞狂潮整体上来说,网民对地震议题关注度较高,自然灾害类话题一旦爆发,很容易引起人们情感共鸣,掀起热潮。但从点赞数来看,“中国救援回应”类的总点赞与平均点赞都是最高的,网民对地震的关注点并非地震本身,而是与之相关的“政府行动”。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。而爱国新闻则往往是最容易煽动民族情绪,产生民族优越感,激起点赞狂潮。 人的关注小于国民尊严的保护另一方面,国内地震的关注度却很少,不仅体现在政府救援的报道量小,网民的兴趣点与评价也较低。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。“发改委与地震”的点赞量也相对较高,网民对发改委和地震的调侃,反映出的是对油价上涨的不满,这种“怨气”也容易产生共鸣。一面是民族优越感,一面是对政策不满,两种情绪虽矛盾,但同时体现了网民心理趋同。  数据附表 微文章排行TOP50:公众号排行TOP20:作者:晏雪菲出品单位:南京大学计算传播学实验中心技术支持:南京大学谷尼舆情监测分析实验室题图鸣谢:谷尼舆情新微榜、图悦词云

In [15]:
rmml = soup.find('div', {'class', 'rich_media_meta_list'})
date = rmml.find(id = 'post-date').text
rmc = soup.find('div', {'class', 'rich_media_content'})
content = rmc.get_text()
print title
print date
print content
南大新传 | 微议题:地震中民族自豪—“中国人先撤”
2015-05-04

点击上方“微议题排行榜”可以订阅哦!导读2015年4月25日,尼泊尔发生8.1级地震,造成至少7000多人死亡,中国西藏、印度、孟加拉国、不丹等地均出现人员伤亡。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。  热词图现 本文以“地震”为关键词,选取了2015年4月10日至4月30日期间微议题TOP100阅读排行进行分析。根据微议题TOP100标题的词频统计,我们可以看出有关“地震”的话题最热词汇的有“尼泊尔”、“油价”、“发改委”。4月25日尼泊尔发生了8级地震,深受人们的关注。面对国外灾难性事件,微媒体的重心却转向“油价”、“发改委”、“祖国先撤”,致力于将世界重大事件与中国政府关联起来。  微议题演化趋势 总文章数总阅读数从4月10日到4月30日,有关“地震”议题出现三个峰值,分别是在4月15日内蒙古地震,20日台湾地震和25日尼泊尔地震。其中对台湾地震与内蒙古地震报道文章较少,而对尼泊尔地震却给予了极大的关注,无论是在文章量还是阅读量上都空前增多。内蒙古、台湾地震由于级数较小,关注少,议程时间也比较短,一般3天后就会淡出公共视野。而尼泊尔地震虽然接近性较差,但规模大,且衍生话题性较强,其讨论热度持续了一周以上。  议题分类 如图,我们将此议题分为6大类。1尼泊尔地震这类文章是对4月25日尼泊尔地震的新闻报道,包括现场视频,地震强度、规模,损失程度、遇难人员介绍等。更进一步的,有对尼泊尔地震原因探析,认为其处在板块交界处,灾难是必然的。因尼泊尔是佛教圣地,也有从佛学角度解释地震的启示。2国内地震报道主要是对10日内蒙古、甘肃、山西等地的地震,以及20日台湾地震的报道。偏重于对硬新闻的呈现,介绍地震范围、级数、伤亡情况,少数几篇是对甘肃地震的辟谣,称其只是微震。3中国救援回应地震救援的报道大多是与尼泊尔地震相关,并且80%的文章是中国政府做出迅速反应派出救援机接国人回家。以“中国人又先撤了”,来为祖国点赞。少数几篇是滴滴快的、腾讯基金、万达等为尼泊尔捐款的消息。4发改委与地震这类文章内容相似,纯粹是对发改委的调侃。称其“预测”地震非常准确,只要一上调油价,便会发生地震。5地震常识介绍该类文章介绍全国地震带、地震频发地,地震逃生注意事项,“专家传受活命三角”,如何用手机自救等小常识。6地震中的故事讲述地震中的感人瞬间,回忆汶川地震中的故事,传递“:地震无情,人间有情”的正能量。 国内外地震关注差异大关于“地震”本身的报道仍旧是媒体关注的重点,尼泊尔地震与国内地震报道占一半的比例。而关于尼泊尔话题的占了45%,国内地震相关的只有22%。微媒体对国内外地震关注有明显的偏差,而且在衍生话题方面也相差甚大。尼泊尔地震中,除了硬新闻报道外,还有对其原因分析、中国救援情况等,而国内地震只是集中于硬新闻。地震常识介绍只占9%,地震知识普及还比较欠缺。  阅读与点赞分析  爱国新闻容易激起点赞狂潮整体上来说,网民对地震议题关注度较高,自然灾害类话题一旦爆发,很容易引起人们情感共鸣,掀起热潮。但从点赞数来看,“中国救援回应”类的总点赞与平均点赞都是最高的,网民对地震的关注点并非地震本身,而是与之相关的“政府行动”。尼泊尔地震后,祖国派出救援机接国人回家,这一“先撤”行为被大量报道,上演了一出霸道总裁不由分说爱国民的新闻。而爱国新闻则往往是最容易煽动民族情绪,产生民族优越感,激起点赞狂潮。 人的关注小于国民尊严的保护另一方面,国内地震的关注度却很少,不仅体现在政府救援的报道量小,网民的兴趣点与评价也较低。我们对“地震”中人的关注,远远小于国民尊严的保护。通过“撤离”速度来证明中国的影响力也显得有失妥当,灾难应急管理、救援和灾后重建能力才应是“地震”关注焦点。“发改委与地震”的点赞量也相对较高,网民对发改委和地震的调侃,反映出的是对油价上涨的不满,这种“怨气”也容易产生共鸣。一面是民族优越感,一面是对政策不满,两种情绪虽矛盾,但同时体现了网民心理趋同。  数据附表 微文章排行TOP50:公众号排行TOP20:作者:晏雪菲出品单位:南京大学计算传播学实验中心技术支持:南京大学谷尼舆情监测分析实验室题图鸣谢:谷尼舆情新微榜、图悦词云

尝试抓取阅读数和点赞数

In [47]:
url = 'http://mp.weixin.qq.com/s?src=3&timestamp=1463191394&ver=1&signature=cV3qMIBeBTS6i8cJJOPu98j-H9veEPx0Y0BekUE7F6*sal9nkYG*w*FwDiaySIfR4XZL-XFbo2TFzrMxEniDETDYIMRuKmisV8xjfOcCjEWmPkYfK57G*cffYv4JxuM*RUtN8LUIg*n6Kd0AKB8--w=='
In [48]:
content = urllib2.urlopen(url).read() #获取网页的html文本
soup = BeautifulSoup(content, 'html.parser') 
In [49]:
print soup
<!DOCTYPE html>

<html>
<head>
<meta content="text/html; charset=utf-8" http-equiv="Content-Type">
<meta content="IE=edge" http-equiv="X-UA-Compatible">
<meta content="width=device-width,initial-scale=1.0,maximum-scale=1.0,user-scalable=0" name="viewport"/>
<meta content="yes" name="apple-mobile-web-app-capable">
<meta content="black" name="apple-mobile-web-app-status-bar-style">
<meta content="telephone=no" name="format-detection">
<script type="text/javascript">
            window.logs = {
                pagetime: {}
            };
            window.logs.pagetime['html_begin'] = (+new Date());
        </script>
<script type="text/javascript"> 

    var page_begintime = (+new Date());

    var biz = ""||"MjM5NzE0ODM2MA==";
    var sn = "" || ""|| "be39ae0b1519b7f9ae644d4f0a0f449b";
    var mid = "" || ""|| "400316403";
    var idx = "" || "" || "2";

    
    var is_rumor = ""*1;
    var norumor = ""*1;
    if (!!is_rumor&&!norumor){
      if (!document.referrer || document.referrer.indexOf("mp.weixin.qq.com/mp/rumor") == -1){
        location.href = "http://mp.weixin.qq.com/mp/rumor?action=info&__biz=" + biz + "&mid=" + mid + "&idx=" + idx + "&sn=" + sn + "#wechat_redirect";
      }
    }

    
    
</script>
<script type="text/javascript">
var MutationObserver = window.WebKitMutationObserver||window.MutationObserver||window.MozMutationObserver;
var isDangerSrc = function(src) {
    if(src) {
        var host = src.match(/http(?:s)?:\/\/([^\/]+?)(\/|$)/);
        if(host && !/qq\.com$/.test(host[1])) {
            return true;
        }
    }
    return false;
}
var ishttp = location.href.indexOf("http://")==0;
if (ishttp && typeof MutationObserver === 'function') {
    window.__observer_data = {count:0, exec_time: 0, list:[]};
    window.__observer = new MutationObserver(function(mutations) {
        
        window.__observer_data.count++;
        var begin = new Date(), deleteNodes = [];
        mutations.forEach(function(mutation) {
            var nodes = mutation.addedNodes;
            for (var i = 0; i < nodes.length; i++) {
                var node = nodes[i];

                if (node.tagName === 'SCRIPT') {
                    var scriptSrc = node.src;
                    if(isDangerSrc(scriptSrc)) {
                        window.__observer_data.list.push(scriptSrc);
                        deleteNodes.push(node);
                    }
                
                }
            }
        });
        for(var i=0; i<deleteNodes.length; i++) {
            var node = deleteNodes[i];
            node.parentNode.removeChild(node);
        }
        window.__observer_data.exec_time += (new Date() - begin);
    });
    window.__observer.observe(document, {subtree: true, childList: true});
}
(function() {
    if (Math.random()<0.01 && ishttp && HTMLScriptElement.prototype.__lookupSetter__ && typeof Object.defineProperty !== "undefined") {
        window.__danger_src = {xmlhttprequest:[], script_src: [], script_setAttribute: []};
        var t = "$"+Math.random();
        
        
        HTMLScriptElement.prototype.__old_method_script_src = HTMLScriptElement.prototype.__lookupSetter__ ('src');
        HTMLScriptElement.prototype.__defineSetter__ ('src', function(url) {
            if (url && isDangerSrc(url)) {
                
                window.__danger_src.script_src.push(url);
            }
            this.__old_method_script_src(url);
        });
        var element_setAttribute_method = "element_setAttribute"+t;
        Object.defineProperty(Element.prototype, element_setAttribute_method, {
            value: Element.prototype.setAttribute,
            enumerable: false
        });
        Element.prototype.setAttribute = function(name, url) {
            if (this.tagName == 'SCRIPT' && name == 'src' && isDangerSrc(url)) {
                
                window.__danger_src.script_setAttribute.push(url);
            }
            this[element_setAttribute_method](name, url);
        };
    }
})();
</script>
<link href="//res.wx.qq.com" rel="dns-prefetch">
<link href="//mmbiz.qpic.cn" rel="dns-prefetch">
<link href="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/common/favicon22c41b.ico" rel="shortcut icon" type="image/x-icon">
<script type="text/javascript">
    String.prototype.html = function(encode) {
        var replace =["&#39;", "'", "&quot;", '"', "&nbsp;", " ", "&gt;", ">", "&lt;", "<", "&amp;", "&", "&yen;", "¥"];
        if (encode) {
            replace.reverse();
        }
        for (var i=0,str=this;i< replace.length;i+= 2) {
             str=str.replace(new RegExp(replace[i],'g'),replace[i+1]);
        }
        return str;
    };

    window.isInWeixinApp = function() {
        return /MicroMessenger/.test(navigator.userAgent);
    };

    window.getQueryFromURL = function(url) {
        url = url || 'http://qq.com/s?a=b#rd'; 
        var query = url.split('?')[1].split('#')[0].split('&'),
            params = {};
        for (var i=0; i<query.length; i++) {
            var arg = query[i].split('=');
            params[arg[0]] = arg[1];
        }
        if (params['pass_ticket']) {
        	params['pass_ticket'] = encodeURIComponent(params['pass_ticket'].html(false).html(false).replace(/\s/g,"+"));
        }
        return params;
    };

    (function() {
	    var params = getQueryFromURL(location.href);
        window.uin = params['uin'] || '';
        window.key = params['key'] || '';
        window.wxtoken = params['wxtoken'] || '';
        window.pass_ticket = params['pass_ticket'] || '';
    })();

</script>
<title>维密还没开始,海尔就先来了一场生活大秀</title>
<link href="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/style/page/appmsg/page_mp_article_improve2d1390.css" rel="stylesheet" type="text/css">
<style>
</style>
<!--[if lt IE 9]>
<link rel="stylesheet" type="text/css" href="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/style/page/appmsg/page_mp_article_improve_pc2c9cd6.css">
<![endif]-->
<script type="text/javascript">
    document.domain = "qq.com";
</script>
</link></link></link></link></meta></meta></meta></meta></meta></head>
<body class="zh_CN sougou_body" id="activity-detail" ontouchstart="">
<script type="text/javascript">
        var write_sceen_time = (+new Date());
    </script>
<div class="discuss_container editing access" id="js_cmt_mine" style="display:none;">
<div class="discuss_container_inner">
<h2 class="rich_media_title">维密还没开始,海尔就先来了一场生活大秀</h2>
<span id="log"></span>
<div class="frm_textarea_box_wrp">
<span class="frm_textarea_box">
<textarea class="frm_textarea" id="js_cmt_input" placeholder="留言将由公众号筛选后显示,对所有人可见。"></textarea>
<div class="emotion_tool">
<span class="emotion_switch" style="display:none;"></span>
<span class="pic_emotion_switch_wrp" id="js_emotion_switch">
<img alt="" class="pic_default" src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/appmsg/emotion/icon_emotion_switch.2x278965.png">
<img alt="" class="pic_active" src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/appmsg/emotion/icon_emotion_switch_active.2x278965.png">
</img></img></span>
<div class="emotion_panel" id="js_emotion_panel">
<span class="emotion_panel_arrow_wrp" id="js_emotion_panel_arrow_wrp">
<i class="emotion_panel_arrow arrow_out"></i>
<i class="emotion_panel_arrow arrow_in"></i>
</span>
<div class="emotion_list_wrp" id="js_slide_wrapper">
</div>
<ul class="emotion_navs" id="js_navbar">
</ul>
</div>
</div>
</span>
</div>
<div class="discuss_btn_wrp"><a class="btn btn_primary btn_discuss btn_disabled" href="javascript:;" id="js_cmt_submit">提交</a></div>
<div class="discuss_list_wrp" style="display:none">
<div class="rich_tips with_line title_tips discuss_title_line">
<span class="tips">我的留言</span>
</div>
<ul class="discuss_list" id="js_cmt_mylist"></ul>
</div>
<div class="rich_tips tips_global loading_tips" id="js_mycmt_loading">
<img alt="" class="rich_icon icon_loading_white" src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/common/icon_loading_white2805ea.gif">
<span class="tips">加载中</span>
</img></div>
<div class="wx_poptips" id="js_cmt_toast" style="display:none;">
<img alt="" class="icon_toast" src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAGoAAABqCAYAAABUIcSXAAAAGXRFWHRTb2Z0d2FyZQBBZG9iZSBJbWFnZVJlYWR5ccllPAAAA3NpVFh0WE1MOmNvbS5hZG9iZS54bXAAAAAAADw/eHBhY2tldCBiZWdpbj0i77u/IiBpZD0iVzVNME1wQ2VoaUh6cmVTek5UY3prYzlkIj8+IDx4OnhtcG1ldGEgeG1sbnM6eD0iYWRvYmU6bnM6bWV0YS8iIHg6eG1wdGs9IkFkb2JlIFhNUCBDb3JlIDUuNS1jMDE0IDc5LjE1MTQ4MSwgMjAxMy8wMy8xMy0xMjowOToxNSAgICAgICAgIj4gPHJkZjpSREYgeG1sbnM6cmRmPSJodHRwOi8vd3d3LnczLm9yZy8xOTk5LzAyLzIyLXJkZi1zeW50YXgtbnMjIj4gPHJkZjpEZXNjcmlwdGlvbiByZGY6YWJvdXQ9IiIgeG1sbnM6eG1wTU09Imh0dHA6Ly9ucy5hZG9iZS5jb20veGFwLzEuMC9tbS8iIHhtbG5zOnN0UmVmPSJodHRwOi8vbnMuYWRvYmUuY29tL3hhcC8xLjAvc1R5cGUvUmVzb3VyY2VSZWYjIiB4bWxuczp4bXA9Imh0dHA6Ly9ucy5hZG9iZS5jb20veGFwLzEuMC8iIHhtcE1NOk9yaWdpbmFsRG9jdW1lbnRJRD0ieG1wLmRpZDoyMTUxMzkxZS1jYWVhLTRmZTMtYTY2NS0xNTRkNDJiOGQyMWIiIHhtcE1NOkRvY3VtZW50SUQ9InhtcC5kaWQ6MTA3QzM2RTg3N0UwMTFFNEIzQURGMTQzNzQzMDAxQTUiIHhtcE1NOkluc3RhbmNlSUQ9InhtcC5paWQ6MTA3QzM2RTc3N0UwMTFFNEIzQURGMTQzNzQzMDAxQTUiIHhtcDpDcmVhdG9yVG9vbD0iQWRvYmUgUGhvdG9zaG9wIENDIChNYWNpbnRvc2gpIj4gPHhtcE1NOkRlcml2ZWRGcm9tIHN0UmVmOmluc3RhbmNlSUQ9InhtcC5paWQ6NWMyOGVjZTMtNzllZS00ODlhLWIxZTYtYzNmM2RjNzg2YjI2IiBzdFJlZjpkb2N1bWVudElEPSJ4bXAuZGlkOjIxNTEzOTFlLWNhZWEtNGZlMy1hNjY1LTE1NGQ0MmI4ZDIxYiIvPiA8L3JkZjpEZXNjcmlwdGlvbj4gPC9yZGY6UkRGPiA8L3g6eG1wbWV0YT4gPD94cGFja2V0IGVuZD0iciI/Pmvxj1gAAAVrSURBVHja7J15rF1TFMbXk74q1ZKHGlMkJVIhIgg1FH+YEpEQJCKmGBpThRoSs5jVVNrSQUvEEENIhGiiNf9BiERICCFIRbUiDa2qvudbOetF3Tzv7XWGffa55/uS7593977n3vO7e5+199p7v56BgQGh0tcmvAUERREUQVEERREUQVEERREUQVEERREUQVEERREUQVEERREUQVEERVAUQVEERVAUQbVYk+HdvZVG8b5F0xj4RvhouB+eCy8KrdzDJc1RtAX8ILxvx98V1GyCSkN98Cx4z/95/Wn4fj6j6tUEeN4wkFSnw1MJqj5NhBfAuwaUHREUg4lqNMmePVsHll/HFhVfe1t3FwpJI8DXCCquDrCWNN4B6Tb4M3Z98aTPmTvh0YHl18PXw29yZiKejoPvcUD6E74yFBJbVDk6Bb7K8aP/Hb4c/tRzEYIqprPhSxzlf4Uvhb/0Xoig8qnHAJ3lqPMzfDH8XZ4LEpRf2sVdA5/sqPO9Qfop70UJyn+/boaPddT5yrq7VUUvTIVJI7q74MMddXR8NB1eXcYvhBpZm0s2w72/o86HFoKvLau/pYaXzjLMdUJ6y0LwtWV9CIIaXtvA8+G9HHV03u5q+K+yH47U0NoRngPv7KjzHDwTLj0bS1BDazfJJlcnOOostC6ysnCT+q80G/sIvFVgeW09D8FPVT0uoP7VfvAD8NjA8pqmuAN+OcYAjso0RbIZ8DGB5TVNcRO8JMaHY9SXSdfa3eeANJimWBLrA7JFiZwIXye+NMUV8CcxP2SRFjXefok7NRjSGZJlWUPvw2/wtNiQirSoXWyMsR28wR7AzzYM0oXw+Y7yK+CLJGeaoqjyrJSdZJD6Ov4+z5y6NJc0Az7NUecHydIUy+v60KNyQHoM3nKI1y7YCFiq0i7uBvgER52vDdKqWn9djhY1Dn4G3n6Ecqm2rF74dvgoR53S0hQxW9RJAZAGW5bSn58QJA27dQ7uIEedjywEX5NKVxCqsY6y+qA+LxFI4+yZ6oH0trWkNan80jygtIUsc5SflgAsDXgehfdx1KkkTRE76tN+Xue2jnTU0Ru1oIbvpt30bBtKhOp5yaaRkts0lic8V1i6dPcIRx2d/l8Y8XtNNEg7OOo8bl1kmmOKnDsO88CaYzejau0hWZqiL7C83oCH4SeTHvwV2BqqsHRVztSEYOmWF80NeXZT6Hd4KflResE9vCnBOlCyGfDNAstHTVPUDWoQ1t3iW+9WNizvlhfd4aerXd+ThqiMfNR6+9LvOOro5OY5JX2H4+F7HZD+kGzlamMgldWiirQsjcwWFbjmqZJteekJLK9pisvgL6RhKvuciZiwzrWWGapfrPy30kBVcSBIrw0aD3PU0XB6cehntq7rTMf7/2iQlktDVdXJLXlg6VjmiYBn6rWSTRCH6hvJ0hQrpcGq8oidsmHpTP8t8DGO9/vcWt9qabiqPgup1yKyQwvC2tSefZ73SSpNkUJ4PlLorlHZ+446nc8f3fIyywlJhwrTuwVSjBa1ccvSxN0hjjoK5xVrYZMd9V6XbFfgBukixTwGLg8sDam3dZR/wZ6L/dJlin1en8LS+bgpFbz3Ygvzu1J1HKxYNqxGpCmaCEo12rrBorD6LRp8UbpcdR5VWhTW35KlKd6QFqjuM2XzwlpnMxTvSkuUwuG/Xlg6NtPjbT6WFimF/VG6LEvXgn8QGDjMbBukVECFwhpoS+CQatfX2Q1q6H7wENHdrfCr0lKleEB9JyxNneus+VJpsVL9TwI6W65LovWIGl3KtVJaLv7LBwYTFEERFEVQFEERFEVQFEERFEVQFEERFEVQFEERFEVQFEERFFWq/hFgADUMN4RzT6/OAAAAAElFTkSuQmCC">
<p class="toast_content">已留言</p>
</img></div>
</div>
</div>
<div class="rich_media" id="js_article">
<div class="top_banner" id="js_top_ad_area">
</div>
<div class="rich_media_inner">
<div id="page-content">
<div class="rich_media_area_primary" id="img-content">
<h2 class="rich_media_title" id="activity-name">
                        维密还没开始,海尔就先来了一场生活大秀 
                    </h2>
<div class="rich_media_meta_list">
<em class="rich_media_meta rich_media_meta_text" id="post-date">2015-11-10</em>
<a class="rich_media_meta rich_media_meta_link rich_media_meta_nickname" href="javascript:void(0);" id="post-user">海尔北京</a>
<span class="rich_media_meta rich_media_meta_text rich_media_meta_nickname">海尔北京</span>
<div class="profile_container" id="js_profile_qrcode" style="display:none;">
<div class="profile_inner">
<strong class="profile_nickname">海尔北京</strong>
<img alt="" class="profile_avatar" id="js_profile_qrcode_img" src="">
<p class="profile_meta">
<label class="profile_meta_label">微信号</label>
<span class="profile_meta_value">haier_bj</span>
</p>
<p class="profile_meta">
<label class="profile_meta_label">功能介绍</label>
<span class="profile_meta_value">海尔网络生活智慧,为千家万户打造不拘一格的智能家居体验</span>
</p>
</img></div>
<span class="profile_arrow_wrp" id="js_profile_arrow_wrp">
<i class="profile_arrow arrow_out"></i>
<i class="profile_arrow arrow_in"></i>
</span>
</div>
</div>
<div class="rich_media_content " id="js_content">
<p style="text-align: center;"><strong><span style="font-family: 微软雅黑, sans-serif">今年,维密大秀还没开始</span></strong></p><p style="text-align: center;"><strong><span style="font-family: 微软雅黑, sans-serif">海尔就在双11发酵的时候</span></strong></p><p style="text-align: center;"><strong><span style="font-family: 微软雅黑, sans-serif">来了一场生活大秀</span></strong></p><p style="text-align: center;"><strong><span style="font-family: 微软雅黑, sans-serif">属于海尔双11的“天使翅膀”可见轮廓</span></strong></p><p style="text-align: center;"><img data-ratio="0.6370558375634517" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAdv3kzH9XcTibnibvxDFSQHIUhO4fKM8UsPeenAJgUKHo2KF0114pzf6A/0?wx_fmt=png" data-type="png" data-w="394"/><br/></p><p style="text-align: center;"><strong><span style="font-size: 16px;font-family: 微软雅黑, sans-serif">今年双11,海尔玩不同,超级学校吹响大咖集结号!</span></strong></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">又是一年双11</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">唱主角的不是嗖嗖的小北风和单身汪</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">占据各大头条的是那群</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">在战火中厮杀的Buy家娘们和各大品牌</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">去年家电销售量第一的品牌大佬海尔,今年又有大动作——</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">竟办起学校传授“享乐主义”!还是O2O授课模式!</span></p><p style="margin-left: 28px; text-align: center;"><span style="font-family:微软雅黑,sans-serif"><img data-ratio="1.3702928870292888" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edA2l93yqoy8FUYwkx1I0Hub3F1Gib63iandAUoeLVDVJeibdbka1n3yp44A/0?wx_fmt=jpeg" data-type="jpeg" data-w="478"/><br/></span></p><p style="margin-left: 28px; text-align: center;"><span style="font-family:微软雅黑,sans-serif">海尔、统帅、青啤、罗莱、茵曼、阿芙、芝华仕、酒仙网</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">媒体、网红、达人、粉丝……</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">各路大咖云集星光闪耀的场面</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">八成是在发布会、奥斯卡,或黄教主大婚</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">万万没想到竟是场开学式?!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif"><img data-ratio="1.3715415019762847" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAGsoSG2C7BicsgAbUGrVs4sb8f14b6pAWdjTJLjluhJiaIicdIxe7l434A/0?wx_fmt=jpeg" data-type="jpeg" data-w=""/><br/></span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">这样大手笔?闹哪样 ?</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">海尔11.11生活+联盟开学式也能如此高调奢华?</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">八大TOP品牌负责人、当红KOL,各路大咖悉数亮相</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">还有重量级葩神——雷洋担任主持,耳熟吗?</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">百度一下就知道有多大牌!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif"><img data-ratio="0.66600790513834" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAQwGEBRcX9xRTykFClHHRJDjvWoBSn6nm9Q3BoqpRm065wQniaaVrAPg/0?wx_fmt=jpeg" data-type="jpeg" data-w=""/><br/></span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">辣么,被称为“互联网+时代的霍格沃茨魔法学校”</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">海尔生活+学院到底能教给我们哪些技能?</span></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif;color:red">咱接着看!</span></strong></p><p style="text-align: center;"><strong><span style="font-size: 16px;font-family: 微软雅黑, sans-serif">剧透2:海尔11.11“生活+”学院,不只吃喝玩乐,主要教你玩转生活!</span></strong></p><p style="text-align: center;"><strong><span style="font-size: 16px;font-family: 微软雅黑, sans-serif"><img data-ratio="1.3621730382293762" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAEjQhjSrCMfW52Glq2HIwgzJPW0ib20xUo1zg6iak7aJUnDVlLyVrPegA/0?wx_fmt=jpeg" data-type="jpeg" data-w="497"/><br/></span></strong></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">体验各种神秘家居、与模特亲密互动,完成任务就赢走肾6s!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">抵制不住诱惑的诸位生活达人、粉丝和媒体人 “宽衣解带”卸下高冷~</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">现场实战把生活玩出高潮~享受起来一个比一个生猛!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">现场打破常规 生活场景真实再现</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">开学式现场直接真实搭建一个畅享生活的jia!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif"><img data-ratio="1" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAqdWD0b0hQhkTxd5e9C1fHib6ID1bQ6HhF9iaRNjmuiaxO7GKsKQqZY8eQ/0?wx_fmt=jpeg" data-type="jpeg" data-w="497"/><br/></span></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">睡了哆啦A喝了白啤醉</span></strong></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">躺了芝华仕喝了红酒美</span></strong></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">水果榨出人生滋味,把生活调戏出大白风味</span></strong></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">衣服穿上范玮琪同款,馨厨冰箱活出健康智能生活惠</span></strong></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">空调和苹果最搭有范儿,配!</span></strong></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">生活+起来,领跑生活嘿!</span></strong></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">生活玩得美,老师要找对!</span></strong></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif"><img data-ratio="1.1118568232662192" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAPWsib2EoQU86xUGa5qFHXv760GnzCxmk1VTWYQSmradXkj5mXG1YgAQ/0?wx_fmt=jpeg" data-type="jpeg" data-w="447"/><br/></span></strong></p><p style="text-align: center;"><strong><span style="font-size: 16px;font-family: 微软雅黑, sans-serif">剧透3:八大品牌师资担当,海尔生活+带你玩转双11</span></strong></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">海尔、统帅、青啤、罗莱、茵曼、阿芙、芝华仕、酒仙网等</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">八大品牌代表正式宣布今年双11“生活+学院”正式成立</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">不教任何书本冷知识,就让你怎么玩转生活</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">畅享今年双11</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif"><img data-ratio="0.66600790513834" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAgBoZ3t7cd0T8TPnvctaCOrVdEoW22vvwO1f5SYOQbiaz6KLlmljRicpQ/0?wx_fmt=jpeg" data-type="jpeg" data-w=""/><br/><span style="color:red"><img data-ratio="0.66600790513834" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edACicQWibfWX6NibyMicdVoMV4gQzsLl6HiapM0PrTGGYI0HNBzicZKnPwnxjA/0?wx_fmt=jpeg" data-type="jpeg" data-w=""/><br/></span></span></p><p style="text-align: center;"><strong><span style="font-size: 16px;font-family: 微软雅黑, sans-serif">剧透4:海尔11.11提前登场没收住,海尔这次玩大了!</span></strong></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">开学玩太嗨,开学式当天海尔11.11多样玩法现场剧透,</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">看样子,今年双11,海尔真的玩大了!</span></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">玩大了1:11.11当天海尔天猫旗舰店,豪洒一千五百万重金</span></strong></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">只要你来玩,海尔就给你送Money!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">赶紧抢,手一抖,就被别人抢走了!</span></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">玩大了2:十大可叠加优惠政策,惠及新老客户</span></strong></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">没错,“可叠加使用”效果超乎想象,越早买奖品越丰厚!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">定好闹表11.11零点开抢</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">十大优惠可累加,24小时惊喜不间断</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">侵袭淫类的“剁手病毒”可真是无药可救了~</span></p><p style="text-align: center;"><strong><span style="font-family:微软雅黑,sans-serif">玩大了3:8大TOP商家,送吃喝玩乐大礼包</span></strong></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">你负责享受,海尔负责埋单;优惠只是手段,玩嗨才是目的!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">“异业联盟”借势双11掀起新生活主义浪潮</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">据说,生活+联盟会一直玩下去</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">让购物有趣方便,消费者更受益</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">八大品牌积分互通、会员权益共享的八大品牌联合政策</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">双11能出现吗?</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">答案……</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif"><img data-ratio="0.7509881422924901" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/miaIWQgrbRJY6mBve39n8EKwPoock3edAOia0QT2KR8ic7icdXKF4zgOSEsSpRRe0MLrYgsE79MUNNWibZlg4bWRMiag/0?wx_fmt=jpeg" data-type="jpeg" data-w=""/><br/></span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">对不起,只能剧透到这里!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">BOSS</span><span style="font-family:微软雅黑,sans-serif">说,再泄密就不发工资了!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">那就11月11日约起~</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif">海尔商城、海尔天猫旗舰店,答案给你,所有福利都给你!</span></p><p style="text-align: center;"><span style="font-family:微软雅黑,sans-serif"> </span></p><p style="text-align: center;"><img data-ratio="0.5316205533596838" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/uXyUiafode1ZWhb9gibiabicq2gEoYbcuibIHLaPNlNxNkPH04MypmOMb2icicPPxfe5U1L5YBRNHj6biawnBzexbkFMAA/0?wx_fmt=jpeg" data-type="jpeg" data-w=""/><br/><img data-ratio="0.44861660079051385" data-s="300,640" data-src="http://mmbiz.qpic.cn/mmbiz/uXyUiafode1b0Kr8NuUPts6Zc86zChAIG20cvj4jKOq21Gc9wQPwiaq6JZfXuiaGrTdkvEuKPqhTohfa5PuZW2QLQ/0" data-type="jpeg" data-w=""/><br/></p>
</div>
<script type="text/javascript">
                        var first_sceen__time = (+new Date());

                        if ("" == 1 && document.getElementById('js_content'))
                            document.getElementById('js_content').addEventListener("selectstart",function(e){ e.preventDefault(); });

                                        (function(){
                            if (navigator.userAgent.indexOf("WindowsWechat") != -1){
                                var link = document.createElement('link');
                                var head = document.getElementsByTagName('head')[0];
                                link.rel = 'stylesheet';
                                link.type = 'text/css';
                                link.href = "http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/style/page/appmsg/page_mp_article_improve_winwx2c9cd6.css";
                                head.appendChild(link);
                            }
                        })();
                    </script>
<link href="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/style/page/appmsg/page_mp_article_improve_combo2d1390.css" rel="stylesheet" type="text/css">
<div class="rich_media_tool" id="js_toobar3">
<div class="media_tool_meta tips_global meta_primary" id="js_read_area3" style="display:none;">阅读 <span id="readNum3"></span></div>
<span class="media_tool_meta meta_primary tips_global meta_praise" id="like3" style="display:none;">
<i class="icon_praise_gray"></i><span class="praise_num" id="likeNum3"></span>
</span>
<a class="media_tool_meta tips_global meta_extra" href="javascript:void(0);" id="js_report_article3" style="display:none;">投诉</a>
</div>
<div class="rich_media_tool" id="js_sg_bar">
<a class="media_tool_meta meta_primary" href="" target="_blank">阅读原文</a>
<div class="media_tool_meta tips_global meta_primary">阅读 <span><span id="sg_readNum3"></span></span></div>
<span class="media_tool_meta meta_primary tips_global meta_praise">
<i class="icon_praise_gray"></i><span class="praise_num"><span class="praise_num" id="sg_likeNum3"></span>
</span>
</span></div>
</link></div>
<div class="rich_media_area_primary sougou" id="sg_tj" style="display:none">
</div>
<div class="rich_media_area_extra">
<div class="mpda_bottom_container" id="js_bottom_ad_area">
</div>
<div id="js_iframetest" style="display:none;"></div>
<div class="rich_media_extra" id="sg_cmt_area">
<div class="discuss_container" id="sg_cmt_main" style="display:none">
<div class="rich_tips with_line title_tips discuss_title_line">
<span class="tips">精选留言</span>
</div>
<ul class="discuss_list" id="sg_cmt_list"></ul>
</div>
<div class="rich_tips tips_global loading_tips" id="sg_cmt_loading">
<img alt="" class="rich_icon icon_loading_white" src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/common/icon_loading_white2805ea.gif">
<span class="tips">加载中</span>
</img></div>
<div class="rich_tips with_line tips_global" id="sg_cmt_statement" style="display:none">
<span class="tips">以上留言由公众号筛选后显示</span>
</div>
<p class="rich_split_tips tc" id="sg_cmt_qa" style="display:none;">
<a href="http://kf.qq.com/touch/sappfaq/150211YfyMVj150313qmMbyi.html?scene_id=kf264">
                                了解留言功能详情
                            </a>
</p>
</div>
</div>
</div>
<div class="qr_code_pc_outer" id="js_pc_qr_code" style="display:none;">
<div class="qr_code_pc_inner">
<div class="qr_code_pc">
<img class="qr_code_pc_img" id="js_pc_qr_code_img">
<p>微信扫一扫<br>关注该公众号</br></p>
</img></div>
</div>
</div>
</div>
</div>
<script>
    var __DEBUGINFO = {
        debug_js : "http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/debug/console2ca724.js",
        safe_js : "http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/safe/moonsafe2d5cb8.js",
        res_list: []
    };
</script>
<script>window.moon_map = {"appmsg/emotion/caret.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/caret278965.js","biz_wap/jsapi/cardticket.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/jsapi/cardticket275627.js","appmsg/emotion/map.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/map278965.js","appmsg/emotion/textarea.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/textarea27cdc5.js","appmsg/emotion/nav.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/nav278965.js","appmsg/emotion/common.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/common278965.js","appmsg/emotion/slide.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/slide2a9cd9.js","pages/report.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/pages/report2c9cd6.js","pages/music_player.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/pages/music_player2b674b.js","pages/loadscript.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/pages/loadscript2c9cd6.js","appmsg/emotion/dom.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/dom278965.js","biz_wap/utils/hashrouter.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/utils/hashrouter2805ea.js","a/gotoappdetail.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/a/gotoappdetail2a2c13.js","a/ios.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/a/ios275627.js","a/android.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/a/android2c5484.js","a/profile.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/a/profile29b1f8.js","a/mpshop.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/a/mpshop2da3e2.js","a/card.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/a/card2d1390.js","biz_wap/utils/position.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/utils/position29b1f8.js","appmsg/a_report.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/a_report2d87eb.js","biz_common/utils/respTypes.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/respTypes2c57d0.js","appmsg/cmt_tpl.html.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/cmt_tpl.html2a2c13.js","sougou/a_tpl.html.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/sougou/a_tpl.html2c6e7c.js","appmsg/emotion/emotion.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/emotion/emotion2a9cd9.js","biz_common/utils/report.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/report275627.js","biz_common/utils/huatuo.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/huatuo293afc.js","biz_common/utils/cookie.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/cookie275627.js","pages/voice_component.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/pages/voice_component2c5484.js","new_video/ctl.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/new_video/ctl2d441f.js","biz_common/utils/monitor.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/monitor2a30ee.js","biz_common/utils/spin.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/spin275627.js","biz_wap/jsapi/pay.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/jsapi/pay275627.js","appmsg/reward_entry.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/reward_entry2db716.js","appmsg/comment.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/comment2d39f3.js","appmsg/like.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/like2b5583.js","appmsg/a.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/a2da3e2.js","pages/version4video.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/pages/version4video2c7543.js","rt/appmsg/getappmsgext.rt.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/rt/appmsg/getappmsgext.rt2c21f6.js","biz_wap/utils/storage.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/utils/storage2a74ac.js","biz_common/tmpl.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/tmpl2b3578.js","appmsg/img_copyright_tpl.html.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/img_copyright_tpl.html2a2c13.js","appmsg/a_tpl.html.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/a_tpl.html2d1390.js","biz_common/ui/imgonepx.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/ui/imgonepx275627.js","biz_common/dom/attr.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/dom/attr275627.js","biz_wap/utils/ajax.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/utils/ajax2c7a90.js","biz_common/utils/string/html.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/string/html29f4e9.js","sougou/index.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/sougou/index2c7543.js","biz_wap/safe/mutation_observer_report.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/safe/mutation_observer_report2d5cb8.js","appmsg/report.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/report2cf2a3.js","biz_common/dom/class.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/dom/class275627.js","appmsg/report_and_source.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/report_and_source2c0ff9.js","appmsg/page_pos.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/page_pos2d38d6.js","appmsg/cdn_speed_report.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/cdn_speed_report2c57d0.js","appmsg/voice.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/voice2ab8bd.js","appmsg/qqmusic.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/qqmusic2ab8bd.js","appmsg/iframe.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/iframe2cc9e4.js","appmsg/review_image.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/review_image2d0cfe.js","appmsg/outer_link.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/outer_link275627.js","biz_wap/jsapi/core.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/jsapi/core2c30c1.js","biz_common/dom/event.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/dom/event275627.js","appmsg/copyright_report.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/copyright_report2c57d0.js","appmsg/cache.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/cache2a74ac.js","appmsg/pay_for_reading.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/pay_for_reading2c5484.js","appmsg/async.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/async2da3e2.js","biz_wap/ui/lazyload_img.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/ui/lazyload_img2b18f6.js","biz_common/log/jserr.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/log/jserr2805ea.js","appmsg/share.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/share2daac1.js","biz_wap/utils/mmversion.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/utils/mmversion275627.js","appmsg/cdn_img_lib.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/cdn_img_lib275627.js","biz_common/utils/url/parse.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_common/utils/url/parse2d1e61.js","biz_wap/utils/device.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/utils/device2b3aae.js","biz_wap/jsapi/a8key.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/jsapi/a8key2a30ee.js","appmsg/index.js":"http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/appmsg/index2d625d.js"};</script><script src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/moon2c7b0a.js" type="text/javascript"></script>
<script id="voice_tpl" type="text/html">        
        <span id="voice_main_<#=voiceid#>_<#=posIndex#>" class="db audio_area <#if(!musicSupport){#> unsupport<#}#>">
            <span class="tc tips_global unsupport_tips" <#if(show_not_support!==true){#>style="display:none;"<#}#>>
            当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放            </span>
            <span class="audio_wrp db">
                <span id="voice_play_<#=voiceid#>_<#=posIndex#>" class="audio_play_area">
                    <i class="icon_audio_default"></i>
                    <i class="icon_audio_playing"></i>
                    <img src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/appmsg/audio/icon_audio_unread26f1f1.png" alt="" class="pic_audio_default">
                </span>
                <span class="audio_length tips_global"><#=duration_str#></span>
                <span class="db audio_info_area">
                    <strong class="db audio_title"><#=title#></strong>
                    <span class="audio_source tips_global"><#if(window.nickname){#>来自<#=window.nickname#><#}#></span>
                </span>
                <span id="voice_progress_<#=voiceid#>_<#=posIndex#>" class="progress_bar" style="width:0px;"></span>
            </span>
        </span>
    </script>
<script id="qqmusic_tpl" type="text/html">        
        <span id="qqmusic_main_<#=comment_id#>_<#=posIndex#>" class="db qqmusic_area <#if(!musicSupport){#> unsupport<#}#>">
            <span class="tc tips_global unsupport_tips" <#if(show_not_support!==true){#>style="display:none;"<#}#>>
            当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放            </span>
            <span class="db qqmusic_wrp">
                <span class="db qqmusic_bd">
                    <span id="qqmusic_play_<#=musicid#>_<#=posIndex#>" class="play_area">
                        <i class="icon_qqmusic_switch"></i>
                        <img src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/appmsg/qqmusic/icon_qqmusic_default.2x26f1f1.png" alt="" class="pic_qqmusic_default">
                        <img src="<#=music_img#>" data-autourl="<#=audiourl#>" data-musicid="<#=musicid#>" class="qqmusic_thumb" alt="">
                    </span>
                                        <a id="qqmusic_home_<#=musicid#>_<#=posIndex#>" href="javascript:void(0);" class="access_area">
                        <span class="qqmusic_songname"><#=music_name#></span>
                        <span class="qqmusic_singername"><#=singer#></span>
                        <span class="qqmusic_source"><img src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/icon/appmsg/qqmusic/icon_qqmusic_source263724.png" alt=""></span>
                    </a>
                </span>
            </span>       
        </span>
    </script>
<script type="text/javascript">
      var not_in_mm_css = "http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/style/page/appmsg/not_in_mm2c9cd6.css";
      var windowwx_css = "http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/style/page/appmsg/page_mp_article_improve_winwx2c9cd6.css";
      var tid = "";
      var aid = "";
      var clientversion = "0";
      var appuin = ""||"MjM5NzE0ODM2MA==";

      var source = "";
      var scene = 75;
      
      var itemidx = "";

      var _copyright_stat = "0";
      var _ori_article_type = "";

      var nickname = "海尔北京";
      var appmsg_type = "9";
      var ct = "1447147910";
      var publish_time = "2015-11-10" || "";
      var user_name = "gh_63d8d14efccb";
      var user_name_new = "";
      var fakeid   = "";
      var version   = "";
      var is_limit_user   = "0";
      var round_head_img = "http://mmsns.qpic.cn/mmsns/uXyUiafode1btBWqEK4F7RF94J5pJ2Yeu31p2PmzfBX6XqaUyEOw0Nw/0";
      var msg_title = "维密还没开始,海尔就先来了一场生活大秀";
      var msg_desc = "今年,维密大秀还没开始海尔就在双11发酵的时候来了一场生活大秀属于海尔双11的“天使翅膀”可见轮廓今年双11";
      var msg_cdn_url = "http://mmbiz.qpic.cn/mmbiz/uXyUiafode1ZfQAZeRM6GiaIb8mpqaurspG4Pu9XPw5QEiblfbqVW0MlhwQN4X5SicvOXZ2Yh9obx7b2kBefHXiauRw/0?wx_fmt=jpeg";
      var msg_link = "http://mp.weixin.qq.com/s?__biz=MjM5NzE0ODM2MA==&amp;mid=400316403&amp;idx=2&amp;sn=be39ae0b1519b7f9ae644d4f0a0f449b#rd";
      var user_uin = "0"*1;
      var msg_source_url = '';
      var img_format = 'jpeg';
      var srcid = '';
      var networkType;
      var appmsgid = '' || ''|| "400316403";
      var comment_id = "0" * 1;
      var comment_enabled = "" * 1;
      var is_need_reward = "0" * 1;
      var is_https_res = ("" * 1) && (location.protocol == "https:");

      var devicetype = "";
      var source_username = "";  
      var profile_ext_signature = "" || "";
      var reprint_ticket = "";
      var source_mid = "";
      var source_idx = "";

      var show_comment = "";
      var __appmsgCgiData = {
            can_use_page : "0"*1,
            is_wxg_stuff_uin : "0"*1,
            card_pos : "",
            copyright_stat : "0",
            source_biz : "",
            hd_head_img : "http://wx.qlogo.cn/mmhead/Q3auHgzwzM5pUsCtUC0NYmbCicrj226uYQvic4duuMu480fMCPqtzM3g/0"||(window.location.protocol+"//"+window.location.host + "http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/pic/appmsg/pic_rumor_link.2x264e76.jpg")
      };
      var _empty_v = "http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/images/pic/pages/voice/empty26f1f1.mp3";

      var copyright_stat = "0" * 1;

      var pay_fee = "" * 1;
      var pay_timestamp = "";
      var need_pay = "" * 1;

      var need_report_cost = "0" * 1;
      var use_tx_video_player = "0" * 1;

      var friend_read_source = "" || "";
      var friend_read_version = "" || "";
      var friend_read_class_id = "" || "";

      var is_only_read = "1" * 1;

      
            window.wxtoken = "";
          if(!!window.__initCatch){
        window.__initCatch({
            idkey : 27613,
            startKey : 0,
            limit : 128,
            reportOpt : {
                uin : uin,
                biz : biz,
                mid : mid,
                idx : idx,
                sn  : sn
            },
            extInfo : {
                network_rate : 0.01    
            }
        });
    }
  </script>
<script type="text/javascript">
            window.isSg=true;
        window.sg_qr_code="/rr?timestamp=1463194316&src=3&ver=1&signature=OPPQA7aOWPCbC-c788NOa1wcSscBZ-Y0haA7lCXE2X0w-59MIasW5FOzhGXXu5o6FXKhTYfRSYV46UwC3DVHRZhW-D2WRPYjWI8EVt4hc5U=";
        window.sg_data={
            src:"3",
            ver:"1",
            timestamp:"1463191394",
            signature:"cV3qMIBeBTS6i8cJJOPu98j-H9veEPx0Y0BekUE7F6*sal9nkYG*w*FwDiaySIfR4XZL-XFbo2TFzrMxEniDETDYIMRuKmisV8xjfOcCjEWmPkYfK57G*cffYv4JxuM*RUtN8LUIg*n6Kd0AKB8--w=="
        }
          seajs.use('appmsg/index.js');
  </script>
</body>
</html>

In [37]:
soup.find(id='sg_likeNum3')
Out[37]:
<span class="praise_num" id="sg_likeNum3"></span>

作业:

  • 抓取复旦新媒体微信公众号最新一期的内容