Merge pull request #2307 from eLRuLL/genspider-no-www-fix

genspider: removing www. from starturl templates

Merge pull request #2307 from eLRuLL/genspider-no-www-fix
genspider: removing www. from starturl templates
dc1f9ad2 · Paul Tremberth · GitHub · 3235bfeb · 118b42ab · dc1f9ad2
4 changed file
--- a/scrapy/templates/spiders/basic.tmpl
+++ b/scrapy/templates/spiders/basic.tmpl
@@ -5,9 +5,7 @@ import scrapy
 class $classname(scrapy.Spider):
    name = "$name"
    allowed_domains = ["$domain"]
-    start_urls = (
-        'http://www.$domain/',
-    )
+    start_urls = ['http://$domain/']

    def parse(self, response):
        pass
--- a/scrapy/templates/spiders/crawl.tmpl
+++ b/scrapy/templates/spiders/crawl.tmpl
@@ -7,7 +7,7 @@ from scrapy.spiders import CrawlSpider, Rule
 class $classname(CrawlSpider):
    name = '$name'
    allowed_domains = ['$domain']
-    start_urls = ['http://www.$domain/']
+    start_urls = ['http://$domain/']

    rules = (
        Rule(LinkExtractor(allow=r'Items/'), callback='parse_item', follow=True),

--- a/scrapy/templates/spiders/csvfeed.tmpl
+++ b/scrapy/templates/spiders/csvfeed.tmpl
@@ -5,7 +5,7 @@ from scrapy.spiders import CSVFeedSpider
 class $classname(CSVFeedSpider):
    name = '$name'
    allowed_domains = ['$domain']
-    start_urls = ['http://www.$domain/feed.csv']
+    start_urls = ['http://$domain/feed.csv']
    # headers = ['id', 'name', 'description', 'image_link']
    # delimiter = '\t'


--- a/scrapy/templates/spiders/xmlfeed.tmpl
+++ b/scrapy/templates/spiders/xmlfeed.tmpl
@@ -5,7 +5,7 @@ from scrapy.spiders import XMLFeedSpider
 class $classname(XMLFeedSpider):
    name = '$name'
    allowed_domains = ['$domain']
-    start_urls = ['http://www.$domain/feed.xml']
+    start_urls = ['http://$domain/feed.xml']
    iterator = 'iternodes' # you can change this; see the docs
    itertag = 'item' # change it accordingly