2012-02-22 10 views
11

Khi gửi yêu cầu GET trực tiếp đến chương trình phụ trợ với If-Modified-Since: Wed, 15 Feb 2012 07:25:00 CET bộ, Apache trả về đúng 304 không có nội dung.Tại sao Varnish không gửi 304 chưa sửa đổi khi tiêu đề If-Modified-Since được gửi?

Khi tôi gửi yêu cầu tương tự thông qua Varnish 3.0.2, nó phản hồi bằng 200 và gửi lại tất cả nội dung mặc dù khách hàng đã có nó. Rõ ràng, đây không phải là việc sử dụng băng thông tốt. Sự hiểu biết của tôi là Varnish hỗ trợ xử lý thông minh của tiêu đề này và nên gửi một 304, vì vậy tôi con số tôi đã làm điều gì đó sai trái với tập tin .vcl của tôi.

Varnishlog cho này:

16 SessionOpen c 84.97.17.233 64416 :80 
    16 ReqStart  c 84.97.17.233 64416 1597323690 
    16 RxRequest c GET 
    16 RxURL  c /fr/CS/CS_AU-Maboreke-6-6-2004.pdf 
    16 RxProtocol c HTTP/1.0 
    16 RxHeader  c Host: www.quotaproject.org 
    16 RxHeader  c User-Agent: Sprawk/1.3 (http://www.sprawk.com/) 
    16 RxHeader  c Accept: */* 
    16 RxHeader  c Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7 
    16 RxHeader  c Connection: close 
    16 RxHeader  c If-Modified-Since: Wed, 15 Feb 2012 07:25:00 CET 
    16 VCL_call  c recv lookup 
    16 VCL_call  c hash 
    16 Hash   c /fr/CS/CS_AU-Maboreke-6-6-2004.pdf 
    16 Hash   c www.quotaproject.org 
    16 VCL_return c hash 
    16 Hit   c 1597322756 
    16 VCL_call  c hit 
    16 VCL_acl  c NO_MATCH CTRLF5 
    16 VCL_return c deliver 
    16 VCL_call  c deliver deliver 
    16 TxProtocol c HTTP/1.1 
    16 TxStatus  c 200 
    16 TxResponse c OK 
    16 TxHeader  c Server: Apache 
    16 TxHeader  c Last-Modified: Wed, 09 Jun 2004 16:07:50 GMT 
    16 TxHeader  c Vary: Accept-Encoding 
    16 TxHeader  c Content-Type: application/pdf 
    16 TxHeader  c Date: Wed, 22 Feb 2012 18:25:05 GMT 
    16 TxHeader  c Age: 12432 
    16 TxHeader  c Connection: close 
    16 Gzip   c U D - 107685 115763 80 796748 861415 
    16 Length  c 98304 
    16 ReqEnd  c 1597323690 1329935105.713264704 1329935106.208528996 0.000071526 0.000068426 0.495195866 
    16 SessionClose c EOF mode 
    16 StatSess  c 84.97.17.233 64416 0 1 1 0 0 0 203 98304 

Nếu tôi hiểu được điều này một cách chính xác, đối tượng đã có trong bộ nhớ cache Varnish, do đó nó không cần phải liên lạc với phụ trợ, nhưng nó thực sự biết Last-Modified vậy tại sao sẽ không đáp ứng với 304?

Và đây là tập tin VCL tôi:

backend idea { 
    # .host = "www.idea.int"; 
    .host = "83.145.60.235"; # IDEA's public website IP 
    .port = "80"; 
} 
backend qp { 
    # .host = "www.quotaproject.org"; 
    .host = "83.145.60.235"; # IDEA's public website IP 
    .port = "80"; 
} 
# 
#Below is a commented-out copy of the default VCL logic. If you 
#redefine any of these subroutines, the built-in logic will be 
#appended to your code. 
# 
sub vcl_recv { 
    # force domain so that Apache handles the VH correctly 
    if (req.http.host ~ "^qp" || req.http.host ~ "quotaproject.org$") { 
    set req.http.Host = "www.quotaproject.org"; 
    set req.backend = qp; 
    } else { 
    # default to idea.int 
    set req.http.Host = "www.idea.int"; 
    set req.backend = idea; 
    } 
    # Before anything else we need to fix gzip compression 
    if (req.http.Accept-Encoding) { 
     if (req.url ~ "\.(jpg|png|gif|gz|tgz|bz2|tbz|mp3|ogg)$") { 
      # No point in compressing these 
      remove req.http.Accept-Encoding; 
     } else if (req.http.Accept-Encoding ~ "gzip") { 
      set req.http.Accept-Encoding = "gzip"; 
     } else if (req.http.Accept-Encoding ~ "deflate") { 
      set req.http.Accept-Encoding = "deflate"; 
     } else { 
      # unknown algorithm 
      remove req.http.Accept-Encoding; 
     } 
    } 
    # ajax requests bypass cache. TODO: Make sure you Javascript implementation for AJAX actually sets XMLHttpRequest 
    if (req.http.X-Requested-With == "XMLHttpRequest") { 
     return(pass); 
    } 
    if (req.request != "GET" && 
    req.request != "HEAD" && 
    req.request != "PUT" && 
    req.request != "POST" && 
    req.request != "TRACE" && 
    req.request != "OPTIONS" && 
    req.request != "DELETE") { 
    /* Non-RFC2616 or CONNECT which is weird. */ 
    return (pipe); 
    } 
    # Purge everything url - this isn't the squid way, but works 
    if (req.url ~ "^/varnishpurge") { 
     if (!client.ip ~ purge) { 
      error 405 "Not allowed."; 
     } 
     if (req.url == "/varnishpurge") { 
      ban("req.http.host == " + req.http.host + " && req.url ~ ^/"); 
      error 841 "Purged site."; 
     } 
     else { 
      ban("req.http.host == " + req.http.host + " && req.url ~ ^" + regsub(req.url, "^/varnishpurge(.*)$", "\1") + "$"); 
      error 842 "Purged page."; 
     } 
    } 
    # spoof the client IP (taken from http://utvbloggen.se/snabb-guide-till-varnish/) 
    remove req.http.X-Forwarded-For; 
    set req.http.X-Forwarded-For = client.ip; 
    # Force delivery from cache even if other things indicate otherwise 
    if (req.url ~ "\.(flv)") { 
    # pipe flash start away 
    return(pipe); 
    } 
    if (req.url ~ "\.(jpg|jpeg|gif|png|tiff|tif|svg|swf|ico|css|vsd|doc|ppt|pps|xls|pdf|mp3|mp4|m4a|ogg|mov|avi|wmv|sxw|zip|gz|bz2|tgz|tar|rar|odc|odb|odf|odg|odi|odp|ods|odt|sxc|sxd|sxi|sxw|dmg|torrent|deb|msi|iso|rpm)$") { 
    # cookies are irrelevant here 
    unset req.http.Cookie; 
    unset req.http.Authorization; 
    } 
    # Force short-circuit to the real site for these dynamic pages 
    if (req.url ~ "/customcf/" || req.url ~ "/uid/editData.cfm" || req.url ~ "^/private/") { 
    return(pass); 
    } 
    # Remove user agent, since Apache will server these resources the same way 
    if (req.http.User-Agent) { 
    set req.http.User-Agent = ""; 
    } 
    if (req.http.Cookie) { 
    # removes all cookies named __utm? (utma, utmb...) - tracking thing 
    set req.http.Cookie = regsuball(req.http.Cookie, "(^|;) *__utm.=[^;]+;? *", "\1"); 
    # remove cStates for RHM boxes (the server doesn't need to know these, JS will handle this client-side) 
    set req.http.cookie = regsub(req.http.cookie, "(;)?cStates=[^;]*", ""); #cStates might sometimes have a blank value 
    # remove ColdFusion session cookie stuff 
    if (!req.url ~ "^/publications/" && !req.url ~ "^/uid/admin/") { 
     set req.http.cookie = regsub(req.http.cookie, "(;)?CFID=[^;]+", ""); 
     set req.http.cookie = regsub(req.http.cookie, "(;)?CFTOKEN=[^;]+", ""); 
    } 
    # Remove the cookie header if it's empty after cleanup 
    if (req.http.cookie ~ "^;? *$") { 
     # The only cookie data left is a semicolon or spaces 
     remove req.http.cookie; 
    } 
    } 
} 
# 
# Called when the requested object was not found in the cache 
# 
sub vcl_hit { 
    # Allow administrators to easily flush the cache from their browser 
    if (client.ip ~ CTRLF5) { 
    if (req.http.pragma ~ "no-cache" || req.http.Cache-Control ~ "no-cache") { 
     set obj.ttl = 0s; 
     return(pass); 
    } 
    } 
} 
# 
# Called when the requested object has been retrieved from the 
# backend, or the request to the backend has failed 
# 
sub vcl_fetch { 
    set beresp.grace = 1h; 
    # strip the cookie before the image is inserted into cache. 
    if (req.url ~ "\.(jpg|jpeg|gif|png|tiff|tif|svg|swf|ico|css|vsd|doc|ppt|pps|xls|pdf|mp3|mp4|m4a|ogg|mov|avi|wmv|sxw|zip|gz|bz2|tgz|tar|rar|odc|odb|odf|odg|odi|odp|ods|odt|sxc|sxd|sxi|sxw|dmg|torrent|deb|msi|iso|rpm)$") { 
    remove beresp.http.set-cookie; 
    set beresp.ttl = 100w; 
    } 
    # Remove CF session cookies for everything but the publications subsite 
    if (!req.url ~ "^/publications/" && !req.url ~ "/customcf/" && !req.url ~ "^/uid/admin/" && !req.url ~ "^/uid/editData.cfm") { 
    remove beresp.http.set-cookie; 
    } 
    if (beresp.ttl < 48h) { 
    set beresp.ttl = 48h; 
    } 
} 
# 
# Called before a cached object is delivered to the client 
# 
sub vcl_deliver { 
    # We'll be hiding some headers added by Varnish. We want to make sure people are not seeing we're using Varnish. 
    remove resp.http.X-Varnish; 
    remove resp.http.Via; 
    # We'd like to hide the X-Powered-By headers. Nobody has to know we can run PHP and have version xyz of it. 
    remove resp.http.X-Powered-By; 
} 

bất cứ ai có thể thấy được vấn đề hay khó khăn?

Cập nhật: Theo http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.9.3

Note: When handling an If-Modified-Since header field, some 
     servers will use an exact date comparison function, rather than a 
     less-than function, for deciding whether to send a 304 (Not 
     Modified) response. 

Có vẻ như điều này có thể hành vi Varnish của. Tôi đang gửi một ngày khác trước ngày sửa đổi cuối cùng của tệp thực, nhưng không chính xác những gì được lưu trong Varnish.

Trả lời

2

Vì câu hỏi này vẫn mở mà không có câu trả lời và một số phiếu bầu, tôi sẽ đăng câu trả lời.

Điều này dường như không phải là vấn đề với Varnish 3.0.0 (chúng tôi đang sử dụng) hoặc phiên bản Varnish hiện tại bạn đang chạy trên trang web của mình.

200 phản ứng OK khi yêu cầu nội dung với một hết hạn If-Modified-Since:

# curl -z "Wed, 09 Jun 2010 16:07:50 GMT" --head "www.quotaproject.org/robots.txt" 
HTTP/1.1 200 OK 
Server: Apache 
Last-Modified: Tue, 22 Jan 2013 13:23:41 GMT 
Vary: Accept-Encoding 
Cache-Control: public 
Content-Type: text/plain; charset=UTF-8 
Date: Mon, 25 Nov 2013 15:00:45 GMT 
Age: 69236 
Connection: keep-alive 
X-Cache: HIT 

304 phản ứng khi If-Modified-Since là sau cuối-Modified date:

# curl -z "Wed, 09 Jun 2013 16:07:50 GMT" --head "www.quotaproject.org/robots.txt" 
HTTP/1.1 304 Not Modified 
Server: Apache 
Last-Modified: Tue, 22 Jan 2013 13:23:41 GMT 
Vary: Accept-Encoding 
Cache-Control: public 
Content-Type: text/plain; charset=UTF-8 
Date: Mon, 25 Nov 2013 15:00:52 GMT 
Age: 69243 
Connection: keep-alive 
X-Cache: HIT 

Các giống với ví dụ bạn đã đưa ra trong kết quả varnishlog:

# curl -z "Wed, 15 Feb 2012 07:25:00 CET" --head "www.quotaproject.org/fr/CS/CS_AU-Maboreke-6-6-2004.pdf" 
HTTP/1.1 304 Not Modified 
Server: Apache 
Last-Modified: Wed, 09 Jun 2004 16:07:50 GMT 
Cache-Control: public 
Content-Type: application/pdf 
Accept-Ranges: bytes 
Date: Mon, 25 Nov 2013 15:08:48 GMT 
Age: 335802 
Connection: keep-alive 
X-Cache: HIT 

Tôi sẽ nói Varnish hoạt động như mong đợi ed. Có lẽ đây là một vấn đề với việc xây dựng Varnish bạn đang sử dụng hoặc có một cái gì đó không ổn với phương pháp thử nghiệm. Tôi không thể nhìn thấy bất kỳ vấn đề với VCL của bạn hoặc.

7

Vấn đề là the-giờ không múi giờ trong If-Modified-Since tiêu đề:

If-Modified-Since: Wed, 15 Feb 2012 07:25:00 CET 

Theo http://www.w3.org/Protocols/rfc2616/rfc2616-sec3.html#sec3.3

Tất cả tem ngày/giờ HTTP PHẢI được biểu diễn ở Greenwich Mean Time (GMT), không có ngoại lệ.

Varnish thực hiện yêu cầu nghiêm ngặt này, trong khi Apache xử lý định dạng ngày không chuẩn hơn mạnh mẽ hơn.Đây là lý do tại sao bạn quan sát hành vi khác nhau khi truy vấn Apache trực tiếp.