原创作者: hideto   阅读:3699次   评论:0条   更新时间:2011-06-01    
The Django Book:第11章 生成非HTML内容

通常当我们谈到开发网站时,我们都是指生成一些HTML
当然也有很多HTML之外的东西,我们使用web来发布所有的内容,不仅仅是HTML
到目前为止我们都是在关注通常的HTML生成,但是本章将绕道来看看使用Django生成其它类型的内容
你可以使用Django方便的内建工具来生成一些常见的非HTML内容:
RSS/Atom聚合
Sitemaps,可以被Google,Yahoo和微软的搜索引擎搜索
JSON和XML序列化的模型(通常为AJAX方法使用)
我们将谈到上面的每一个工具,但是首先来看看一些基础

基础
还记得第3章的内容吗?
视图方法或者简短来说视图是简单的Python方法,它得到Web请求并返回Web应答,这个应答可以是Web页面的HTML内容,
或者是一个重定向,或者是404错误,或者是一个XML文档,或者是一个image,...,或者是其它的任何东西
更正式的,Django视图方法必须接受一个HttpRequest实例作为它的第一个参数并且返回一个HttpResponse实例
从视图返回非HTML内容的关键在于HttpResponse类,特别是mimetype构造函数的参数,通过改变mimetype我们可以指示
浏览器我们返回的不同类型的对象
下面是一个简单的例子,我们来看看一个返回PNG图像的视图,为了让事情保持简单,我们只是从硬盘读一个文件:
from django.http import HttpResponse

def my_image(request):
    image_data = open("/path/to/my/image.png", "rb").read()
    return HttpResponse(image_data, mimetype="image/png")

仅此而已!如果你改变open()调用的图像路径为一个真正图像的路径,你可以使用这个非常简单的视图来处理图像,浏览
器将正确的显示它
另外一个需要记住的重要事情是HttpResponse对象实现了Python的标准文件API,这意味着你可以传递一个HttpResponse
实例给Python(或者第三方库)需要文件的任何地方
例如我们看看用Django生成CSV

生成CSV
CSV是通常被电子制表软件使用的简单数据形式,它基本上是表的一系列行,行的每个单元用逗号分隔(CSV表示"逗号分隔
的值"),例如,下面是FAA收集的最近10年的"不规矩"的航空旅客的列表:
Year,Unruly Airline Passengers
1995,146
1996,184
1997,235
1998,200
1999,226
2000,251
2001,299
2002,273
2003,281
2004,304
2005,203

注意参看http://www.faa.gov/data_statistics/passengers_cargo/unruly_passengers/得到此数据
不幸的是,CSV不是正式定义的格式,软件的不同部分生成和使用不同的CSV,这让它有点难以使用
幸运的是,Python有一个标准CSV库csv,它是非常防弹的
和Django使用这个库的关键是csv模块的CSV创建能力表现为类似文件对象,Django的HttpResponse对象也类似文件对象:
import csv
from django.http import HttpResponse

# Number of unruly passengers each year 1995 - 2005
UNRULY_PASSENGERS = [146,184,235,200,226,251,299,273,281,304,203]

def unruly_passengers_csv(request):
    # Create the HttpResponse object with the appropriate CSV header.
    response = HttpResponse(mimetype='text/csv')
    response['Content-Disposition'] = 'attachment; filename=unruly.csv'

    # Create the CSV writer using the HttpResponse as the "file"
    writer = csv.writer(response)
    writer.writerow(['Year', 'Unruly Airline Passengers'])
    for (year, num) in zip(range(1995, 2006), UNRULY_PASSENGERS):
        writer.writerow([year, num])

    return response

代码和注释看起来非常清楚,但是有一些事情需要注意:
1,应答的mime-type为为text/csv,这告诉浏览器文档是一个CSV文件,而不是HTML文件
2,应答有一个另外的Content-Disposition头部,它包含CSV文件的名字,这个头部("attachment")将告诉浏览器提示
一个位置来保存文件(而不是显示它),这个文件名随意,你想叫它什么都可以,它将被浏览器的"Save as..."对话框使用
3,CSV生成API很简单,只是传递response作为第一个参数给csv.writer,csv.writer方法期望一个类似文件的对象,
然后HttpResponse对象来付帐
4,对你的CSV文件的每一行调用writer.writerow,传递一个iterable对象给它,例如列表或者元组
5,CSV模块帮你关注引号,所以你不需要担心escape含有引号或逗号的字符串,只需传递信息给writerow(),它将给你
做正确的事情
你通常将重复这个模式,创建一个HttpResponse应答对象(用一个特殊的mime-type),把它传递给一个期望文件的东西,
然后返回应答,任何你生成非HTML内容的时候都可以这样做
让我们看看一些更多的例子

生成PDF
PDF(Portable Document Format)是Adobe开发的格式,它用来展示可打印的文档,并具有象素完美的格式,内嵌的字体和
2D向量图形,你可以把PDF文档当作可打印文档的数字等价物,确实,PDF通常用在当你需要把一份文档给另一个人打印时
有了绝佳的ReportLab开源库(http://www.reportlab.org/rl_toolkit.html)你可以使用Python和Django轻松
生成PDF,动态生成PDF文件的好处是你可以创建自定义的PDF来满足不同的目的,如为不同的用户或不同的内容等
例如,我们在KUSports.com使用Django和ReportLab来为参加March Madness(大学篮球赛)的人们生成自定义的可打印的
NCAA锦标赛brackets

安装ReportLab
但是,在你生成任何PDF之前你需要安装ReportLab,这通常很简单
只需从http://www.reportlab.org/downloads.html下载和安装库
用户手册(不巧也是PDF文件)在http://www.reportlab.org/rsrc/userguide.pdf并有额外的安装帮助
注意,如果你使用时髦的Linux发布,你可能想在手动安装ReportLab前检查你的包管理工具,大部分包资源库已经
包含了ReportLab,例如,如果你使用(绝佳的)Ubuntu发布,一个简单的aptitude install python-reportlab将很好的
安装它
通过在Python交互解释器里import它来测试你的安装:
>>> import reportlab

如果上面的命令不触发任何错误,表明安装的组件已经工作

写视图
再说一遍,使用Django动态生成PDF的关键是ReportLab API基于类似文件的对象,而且Django的HttpResponse对象也是
类似文件的对象,这里是一个"Hello World"例子:
from reportlab.pdfgen import canvas
from django.http import HttpResponse

def hello_pdf(request):
    # Create the HttpResponse object with the appropriate PDF headers.
    response = HttpResponse(mimetype='application/pdf')
    response['Content-Disposition'] = 'attachment; filename=hello.pdf'

    # Create the PDF object, using the response object as its "file."
    p = canvas.Canvas(response)

    # Draw things on the PDF. Here's where the PDF generation happens.
    # See the ReportLab documentation for the full list of functionality.
    p.drawString(100, 100, "Hello world.")

    # Close the PDF object cleanly, and we're done.
    p.showPage()
    p.save()
    return response

和上面一样,有一些地方需要按顺序注意一下:
1,这里我们使用application/pdf mime-type,这告诉浏览器文档是一个PDF文件,而不是一个HTML文件,如果你不写
这个,浏览器将可能把输出解释为HTML,这将导致在浏览器触发错误
2,ReportLab API很简单,只需把response作为第一个参数传递给canva.Canvas,Canvas类期望一个类似文件的对象,
然后HttpResponse对象来付帐
3,所有后面的PDF生成方法在PDF对象(这里是p)上调用,而不是在response上
4,最后,在PDF文件上调用showPage()和save()很重要(否则你将得到一个糟糕的PDF文件)

复杂的PDF
如果你使用ReportLab创建一个复杂的PDF文档,考虑为你的PDF文件使用cStringIO库作为一个临时存储位置,cStringIO
库提供一个非常有效的类似文件的对象接口(比天真的HttpResponse作为文件的实现更好)
这里是使用cStringIO来重写上面的"Hello World"例子:
from cStringIO import StringIO
from reportlab.pdfgen import canvas
from django.http import HttpResponse

def hello_pdf(request):
    # Create the HttpResponse object with the appropriate PDF headers.
    response = HttpResponse(mimetype='application/pdf')
    response['Content-Disposition'] = 'attachment; filename=hello.pdf'

    buffer = StringIO()

    # Create the PDF object, using the StringIO object as its "file."
    p = canvas.Canvas(buffer)

    # Draw things on the PDF. Here's where the PDF generation happens.
    # See the ReportLab documentation for the full list of functionality.
    p.drawString(100, 100, "Hello world.")

    # Close the PDF object cleanly.
    p.showPage()
    p.save()

    # Get the value of the StringIO buffer and write it to the response.
    response.write(buffer.getvalue())
    return response


其它可能性
用Python你可以生成整个世界的其它类型的内容,这里是一些更多的主意,其中一些是你可以用来实现它们的库:
生成ZIP文件:Python的zipfile模块的标准库,它可以读写压缩的ZIP文件,你可以使用它来提供任意文件的存档,
或者有需求时把大文档压缩,你同样可以使用标准库的tarfile模块来生成TAR文件
动态图像生成:Python图像库(http://www.pythonware.com/products/pil/)是一个非常奇妙的用来生成图像
(PNG,JPEG,GIF等等)的工具库,你可以用它来自动缩小图像,把多幅图像组合成单独画面,甚至做基于web的图像处理
分图和制图:有许多不可思议的强大的Python分图和制图库,你可以用它们生成任意的maps,charts,plots和graphs
我们不能列出所有的,所以这里是一些不错的:
matplotlib(http://matplotlib.sourceforge.net/),它可以用来生成通常用MatLab或者Mathematica来生成
的高质量的plots
pygraphviz(https://networkx.lanl.gov/wiki/pygraphviz)
这是一个Graphviz图形布局工具库(http://graphviz.org/)的接口,用来生成图形或网络的结构化diagrams
通常来说,任何可以写文件的Python库都可以在Django中使用,可能性真的是无限的
既然我们看到了生成非HTML内容的基础,让我们进一步抽象,Django带有一些非常俏皮的内建工具用来生成一些通常类型
的非HTML内容

聚合框架
Django带有一个高级的聚合生成框架,它让创建RSS和Atom feeds非常容易
什么是RSS?什么是Atom?
RSS和Atom都是基于XML的格式,你可以用来提供自动更新你的站点内容的"feeds"
阅读更多关于RSS的内容http://www.whatisrss.com
以及更多关于Atome的内容http://www.atomenabled.org
创建任何聚合只需写一个很短的Python类,你可以想创建多少feeds就创建多少
Django也带一个低级feed生成API,如果你想在Web context之外生成feeds或者用一些更低级的方式的话可以使用它


高级框架概览
高级feed生成框架是一个默认绑定到/feeds/的视图,Django使用URL的其它部分(在/feeds/之后的任何东西)来决定输出
哪个feed
为了创建一个feed,只需写一个Feed类并在你的URL配置里指出(参考第3章和第8章得到更多关于URL配置)

初始化
为了在你的Django站点里激活聚合,你需要把下面的内容添加到你的URL配置:
(r'^feeds/(?P<url>.*)/$', 'django.contrib.syndication.views.feed', {'feed_dict': feeds}),

这会告诉Django使用RSS框架来处理所有的以"feeds/"开头的URL(你可以改变"feeds/"前缀来满足你自己的需求)
这个URL配置有另外一个参数{'feed_dict': feeds},使用这个额外参数来把改URL下发布的feeds传递给聚合框架
特别的,feed_dict应该是一个映射feed的slug(简短URL标签)到它的Feed类的字典
你可以在URL配置本身里定义feed_dict,这里是一个完整的例子:
from django.conf.urls.defaults import *
from myproject.feeds import LatestEntries, LatestEntriesByCategory

feeds = {
    'latest': LatestEntries,
    'categories': LatestEntriesByCategory,
}

urlpatterns = patterns('',
    # ...
    (r'^feeds/(?P<url>.*)/$', 'django.contrib.syndication.views.feed',
        {'feed_dict': feeds}),
    # ...
)

上面的例子注册了两个feeds:
通过LatestEntries展示的feed对应feeds/latest/
通过LatestEntriesByCategory展示的feed对应feeds/categories/
一旦建立好之后,你只需定义Feed类本身

Feed类
一个Feed类是展示聚合feed的简单的Python类,一个Feed可以很简单(例如一个"站点新闻"feed或者显示博客最近条目的
基本feed)也可以更复杂(例如显示博客特殊类别的所有条目,该类别可变)
Feed类必须继承django.contrib.syndication.feeds.Feed,它们可以在你的代码树的任何位置

简单的例子
这个简单的例子来自于chicagocrime.org,描述最近5项新闻条目的feed:
from django.contrib.syndication.feeds import Feed
from chicagocrime.models import NewsItem

class LatestEntries(Feed):
    title = "Chicagocrime.org site news"
    link = "/sitenews/"
    description = "Updates on changes and additions to chicagocrime.org."

    def items(self):
        return NewsItem.objects.order_by('-pub_date')[:5]

这里需要注意的重要事情:
1,这个类继承django.contrib.syndication.feeds.Feed
2,title,link和description对应标准的RSS(title),(link)和(description)元素
3,items()是简单的返回在feed中作为(item)元素的对象列表的方法,尽管这个例子使用Django的数据库API返回
NewsItem对象,items()不一定必须返回模型实例
你可以通过使用Django模型得到一些功能,但是items()可以返回任何你想要类型的对象
只有另一个更多的步骤,在一个RSS feed里,每个(item)有一个(title),(link)和(description),我们需要告诉框架
把哪些数据放到那些元素中
4,为了指定(title)和(description)的内容,创建叫feeds/latest_title.html和feeds/latest_description.html的
Django模板(参考第4章),latest是给定feed的URL配置里指定的slug
注意.html扩展名是必需的
RSS系统为每个条目渲染该模板,并传递两个模板context变量:
obj
当前对象(在items()里返回的对象里的一个)
site
一个显示当前站点的django.models.core.sites.Site对象,它对{{ site.domain }}或者{{ site.name }}有用
如果你不为title或description创建模板,框架将默认使用模板"{{ obj }}",对象的普通的字符串展示
你也可以通过指定title_template和description_template作为你的Feed类的属性来改变这两个模板的名字
5,为了指定(link)的内容,你有两个选择,对items()的每个条目,Django首先尝试执行对象的get_absolute_url()方法
如果该方法不存在,则尝试调用Feed类的item_link()方法,并把该对象本身作为参数item传递过去
6,对于上面的LatestEntries例子,我们可以有一些简单的feed模板,latest_title.html包含:
{{ obj.title }}

latest_description.html包含:
{{ obj.description }}

这简直太简单了...

复杂的例子
框架也通过参数提供更复杂的feeds
例如,chicagocrime.org提供一个最近在Chicago每个警察打击的犯罪的RSS feed,为每个警察打击的犯罪创建单独的
Feed类是很愚蠢的,这将违反DRY(Don't Repeat Yourself)原则并把数据和编程逻辑耦合
聚合框架让你构建基于feed的URL信息输出items的通用feeds
在chicagocrime.org,警察打击feeds可以像这样通过URL访问:
/rss/beats/0613/,返回0613打击的最近犯罪
/rss/beats/1424/,返回1424打击的最近犯罪
这里的slug是"beats",聚合框架查看slug后面另外的URL,0613和1424,并可以告诉它那些URL表示什么,以及它们怎样
影响feed中哪些条目被发表
一个例子将把事情解释清楚,这里是那些打击专有的feeds的代码:
from django.core.exceptions import ObjectDoesNotExist

class BeatFeed(Feed):
    def get_object(self, bits):
        # In case of "/rss/beats/0613/foo/bar/baz/", or other such
        # clutter, check that bits has only one member.
        if len(bits) != 1:
            raise ObjectDoesNotExist
        return Beat.objects.get(beat__exact=bits[0])

    def title(self, obj):
        return "Chicagocrime.org: Crimes for beat %s" % obj.beat

    def link(self, obj):
        return obj.get_absolute_url()

    def description(self, obj):
        return "Crimes recently reported in police beat %s" % obj.beat

    def items(self, obj):
        crimes =  Crime.objects.filter(beat__id__exact=obj.id)
        return crimes.order_by('-crime_date')[:30]

这里是RSS框架遵循的基本算法,给定这个类和一个请求到/rss/beats/0613/:
1,框架得到/rss/beats/0613/的URL并注意到在slug后面有一个额外的URL片段,则它通过斜线字符("/")把后面的字符串
分隔开然后调用Feed类的get_object()方法并把片段传递过去
这里的片段是['0613'],对于/rss/beats/0613/foo/bar/的请求,片段则为['0613', 'foo', 'bar']
2,get_object()负责返回从给定片段得到给定的打击
在这里,它使用Django数据库API来查询打击,注意如果给定非法参数的话get_object()应该触发
django.core.exceptions.ObjectDoesNotExist异常,Beat.objects.get()调用没有try/except包围,因为没必要,
这个方法在失败时触发Beat.DoesNotExist,而Beat.DoesNotExist是ObjectDoesNotExist的子类,在get_object()里触发
ObjectDoesNotExist异常告诉Django对该请求产生404错误
3,为了生成feed的(title),(link)和(description),Django使用title(),link()和description()方法,在上个例子
中,它们是简单的字符串类属性,但是这个例子说明它们可以是字符串或者方法,对title,link和description中的任
一个,Django遵循这个算法:
首先,它尝试调用一个方法,传递obj参数,这里obj是get_object()返回的对象
失败的话,它尝试调用一个没有参数的方法
再失败的话,它使用类属性
4,最后,注意这个例子中的items()也需要obj参数,items的算法和上一步描述的一样,它尝试items(obj),然后是
items(),最后是一个items类属性(它应该是一个列表)
Feed类所有方法和属性的完整文档一直可以从Django官方文档得到
参看http://www.djangoproject.com/documentation/syndication/

指定feed类型
默认框架使用RSS2.0生成feeds,这可以通过在你的Feed类添加feed_type属性来更改:
from django.utils.feedgenerator import Atom1Feed

class MyFeed(Feed):
    feed_type = Atom1Feed

注意你设置feed_type为一个类对象,而不是一个实例,当前可以得到的feed类型为:
Feed class                                     Format
django.utils.feedgenerator.Rss201rev2Feed      RSS 2.01(default).
django.utils.feedgenerator.RssUser1and091Feed  RSS 0.91.
django.utils.feedgenerator.Atom1Feed           Atom 1.0.

封装
为了指定封装,如那些用来创建podcast feeds的,使用item_enclosure_url,item_enclosure_length和
item_enclosure_mime_type钩子,例如:
from myproject.models import Song

class MyFeedWithEnclosures(MyFeed):
    title = "Example feed with enclosures"
    link = "/feeds/example-with-enclosures/"

    def items(self):
        return Song.objects.all()[:30]

    def item_enclosure_url(self, item):
        return item.song_url

    def item_enclosure_length(self, item):
        return item.song_length

    item_enclosure_mime_type = "audio/mpeg"

当然这个假设你已经用song_url域和song_length域(即bytes表示的size)创建了Song对象

语言
聚合框架创建的Feeds自动包含合适的(language)标签(RSS 2.0)或者xml:lang属性(Atom)
它直接来自于你的LANGUAGE_CODE设置

URL
link方法/属性可以返回一个绝对URL(例如"/blog/")或者一个具有完整域名和协议的URL
(例如"http://www.example.com/blog/"),如果link不返回域名,则聚合框架将根据你的SITE_ID设置插入当前站点的域名

分别发布Atom和RSS feeds
一些开发者喜欢让他们的feeds的Atom和RSS版本都可用,使用Django很容易做这个:只需创建你的feed类的子类并设置
feed_type为不同的东西,然后更新你的URL配置来添加额外的版本,这里是一个完整的例子:
from django.contrib.syndication.feeds import Feed
from chicagocrime.models import NewsItem
from django.utils.feedgenerator import Atom1Feed

class RssSiteNewsFeed(Feed):
    title = "Chicagocrime.org site news"
    link = "/sitenews/"
    description = "Updates on changes and additions to chicagocrime.org."

    def items(self):
        return NewsItem.objects.order_by('-pub_date')[:5]

class AtomSiteNewsFeed(RssSiteNewsFeed):
    feed_type = Atom1Feed

然后相应的URL配置:
from django.conf.urls.defaults import *
from myproject.feeds import RssSiteNewsFeed, AtomSiteNewsFeed

feeds = {
    'rss': RssSiteNewsFeed,
    'atom': AtomSiteNewsFeed,
}

urlpatterns = patterns('',
    # ...
    (r'^feeds/(?P<url>.*)/$', 'django.contrib.syndication.views.feed',
        {'feed_dict': feeds}),
    # ...
)


sitemap框架
类似于聚合框架,Django也有一个高级的Sitemap生成框架
一个Sitemap是一个你的网站的XML文件,它告诉搜索引擎索索引你的页面的更新频率和你的站点某些页面联系到其它页面
有多"重要",这个信息帮助搜索引擎索引你的站点,参看http://www.sitemaps.org得到更多关于Sitemaps
Django的sitemap框架通过让你用Python代码表达这个信息来自动生成这个XML文件,为了创建一个sitemap,你只需写
一个Sitemap类并在你的URL配置里指向它

安装
遵循下面的步骤来安装sitemap app:
1,添加'django.contrib.sitemaps'到你的INSTALLED_APPS设置
2,确认'django.template.loaders.app_directories.load_template_source'在你的TEMPLATE_LOADERS设置中
它默认在里面,所以如果你改变了这个设置则你将只需更改这个
3,确认你已经安装了sites框架(参考第15章)
注意,sitemap程序不会安装任何数据库表,它需要进入INSTALLED_APPS的唯一的原因是为了让load_template_source
模板载入器可以找到默认的模板

初始化
为了在你的Django站点激活sitemap生成,把下面的内容添加到你的URL配置里:
(r'^sitemap.xml$', 'django.contrib.sitemaps.views.sitemap', {'sitemaps': sitemaps})

这会告诉Django当一个客户端访问/sitemap.xml时构建一个sitemap
sitemap文件名不重要,但是位置很重要,搜索引擎将只为当前及以下的URL级别索引你的sitemap里的链接
例如,如果sitemap.xml存在于你的根目录,它将引用你的站点的任何URL,如果sitemap存在于/content/sitemap.xml,
它将只引用以/content/开始的URL
sitemap使用一个额外的必需参数{'sitemaps': sitemaps},sitemaps应该是一个映射简短的section标签(如blog或者
news)到它的Sitemap类(如BlogSitemap或者NewsSitemap)的字典,它可能也映射一个Sitemap类的实例
(如BlogSitemap(some_var))

Sitemap类
一个Sitemap类是一个表示你的sitemap一部分条目的简单的Python类,例如,一个Sitemap类可以表示你的博客的所有
条目,而另一个可以表示你的日程表的所有的事件
最简单的情况下,所有这些部分混合在一个sitemap.xml里,但是也可以使用框架生成一个sitemap索引并引用单独的
sitemap文件,每个部分一个文件(参看下面的内容)
Sitemap类必须继承django.contrib.sitemaps.Sitemap,它们可以在你的代码树的任意位置
例如,让我们假设你有一个博客系统和一个Entry模型,并且你想让你的sitemap包含所有到你的单独博客条目的链接
这里是你的sitemap类的样子:
from django.contrib.sitemaps import Sitemap
from mysite.blog.models import Entry

class BlogSitemap(Sitemap):
    changefreq = "never"
    priority = 0.5

    def items(self):
        return Entry.objects.filter(is_draft=False)

    def lastmod(self, obj):
        return obj.pub_date

在看过聚合框架之后,这将看起来非常熟悉:
1,changefreq和priority是对应(changefreq)和(priority)元素的类属性,它们可以作为方法来调用,例如lastmod
2,items()是简单的返回对象列表的方法,返回的对象将根据sitemap属性(location,lastmod,changefreq和priority)
传递给任何可调用的方法
3,lastmod应该返回一个Python datetime对象
4,例子中没有location方法,但是你可以为了指出你的对象的URL而提供它,默认location()对每个对象调用
get_absolute_url()并返回结果

Sitemap方法/属性
像Feed类一样,Sitemap成员可以是方法或者属性,参考"复杂的例子"得到更多关于它怎样工作的信息
一个Sitemap类可以定义以下方法/属性:
items(必需)
提供对象列表,框架不关心它们是什么类型的对象,关心的只是这些对象传递给location(),lastmod(),changefreq()
和priority()方法
location(可选)
对给定对象提供绝对的URL
这里"绝对的URL"表示不包含协议和域名的URL,例如:
Good:'/foo/bar/'
Bad:'example.com/foo/bar/'
Bad:'http://example.com/foo/bar/'
如果location没有提供,框架将对items()返回的每个对象调用get_absolute_url()方法
lastmod(可选)
对象的"last modification"日期,是一个Python datetime对象
changefreq(可选)
对象改变的频率,可能的值(Sitemaps规范所给)为:
'always'
'hourly'
'daily'
'weekly'
'monthly'
'yearly'
'never'
priority(可选)
建议的索引优先级别,在0.0和1.0之间,一个页面的默认级别为0.5,参看sitemaps.org文档来得到更多关于priority

捷径
sitemap框架为通常的情况提供了一些方便类:
FlatPageSitemap
django.contrib.sitemaps.FlatPageSitemap类查看当前站点定义的所有flat页面并在sitemap里创建条目,这些条目只
包含location属性,不包含lastmod,changefreq或priority,参考第15章来得到更多关于flat页面
GenericSitemap
GenericSitemap类和你已经有的任何generic views(参考第9章)工作
为了使用它,创建一个实例并传递你传递给generic views的同样的info_dict,仅有的需求是这个字典有一个queryset
条目,它可能也有一个date_field条目来指定从queryset得到的对象的date域,它被用于生成的sitemap的lastmod属性
你也可以传递priority和changefreq关键字参数到GenericSitemap构造函数来为所有的URL指定这些属性
这里是一个使用FlatPageSitemap和GenericSitemap的URL配置的例子(使用上面假定的Entry对象):
from django.conf.urls.defaults import *
from django.contrib.sitemaps import FlatPageSitemap, GenericSitemap
from mysite.blog.models import Entry

info_dict = {
    'queryset': Entry.objects.all(),
    'date_field': 'pub_date',
}

sitemaps = {
    'flatpages': FlatPageSitemap,
    'blog': GenericSitemap(info_dict, priority=0.6),
}

urlpatterns = patterns('',
    # some generic view using info_dict
    # ...

    # the sitemap
    (r'^sitemap.xml$', 'django.contrib.sitemaps.views.sitemap', {'sitemaps': sitemaps})
)


创建sitemap索引
sitemap框架也可以创建一个sitemap索引来引用单独的sitemap文件,即在你的sitemaps字典里定义的每个部分
使用上唯一的区别是:
1,你在URL配置里使用两个视图:django.contrib.sitemaps.views.index和django.contrib.sitemaps.views.sitemap
2,django.contrib.sitemaps.views.sitemap应该使用一个section关键字参数
这里是上面例子的相关的URL配置:
(r'^sitemap.xml$', 'django.contrib.sitemaps.views.index', {'sitemaps': sitemaps})
(r'^sitemap-(?P<section>.+).xml$', 'django.contrib.sitemaps.views.sitemap', {'sitemaps': sitemaps})

这将自动生成一个sitemap.xml文件,它引用sitemap-flatpages.xml和sitemap-blog.xml
而Sitemap类和sitemaps目录根本没有更改

Pinging Google
你可能当你的sitemap更改时想"ping" Google来让它知道重新索引你的站点,框架提供一个方法来做这件事:
django.contrib.sitemaps.ping_google()
注意,本书在写作时,只有Google响应sitemap pings,尽管如此,很可能Yahoo或Microsoft将很快也支持这些pings
那个时候,我们可能更改ping_google()的名字为类似于ping_search_engines(),所以确认查看最近的sitemap文档
http://www.djangoproject.com/documentation/sitemaps/
ping_google()使用一个可选的参数sitemap_url,它应该为你的站点的sitemap(即'/sitemap.xml')的绝对URL
如果这个参数没有提供,ping_google()将尝试通过倒转顺序查看你的URL配置来找出你的sitemap
如果ping_google()不能决定你的sitemap URL,它将触发django.contrib.sitemaps.SitemapNotFound异常
一个有用的调用ping_google()的方式是从一个模型的save()方法:
from django.contrib.sitemaps import ping_google

class Entry(models.Model):
    # ...
    def save(self):
        super(Entry, self).save()
        try:
            ping_google()
        except Exception:
            # Bare 'except' because we could get a variety
            # of HTTP-related exceptions.
            pass

尽管如此,一个更高效的解决方案是从一个cron脚本调用ping_google(),或者一些其它的日程任务,这个方法给Google
的服务器发送一个HTTP请求,所以你可能不想每次你调用save()都招致网络过度

下一步是什么?
下一步,我们将继续深入挖掘Django带给你的俏皮的内建工具,第12章会看到提供用户自定义站点的工具:session,
users和authentication
前进!
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

文章信息

Global site tag (gtag.js) - Google Analytics