2010-03-23 21 views
5

Vấn đề hạn chếđường cong phù hợp tốt nhất cho đường xu hướng

  • Kích thước của tập dữ liệu, nhưng không phải là dữ liệu riêng của mình, được biết đến.
  • Tập dữ liệu tăng một điểm dữ liệu tại một thời điểm.
  • Đường xu hướng được lập biểu đồ một điểm dữ liệu tại một thời điểm (sử dụng đường cong spline/Bezier).

Đồ thị

Ảnh ghép dưới đây cho thấy bộ dữ liệu với đường xu hướng chính xác một cách hợp lý:

enter image description here

Các đồ thị là:

  • Upper-left. Theo giờ, với ~ 24 điểm dữ liệu.
  • Phía trên bên phải. Theo ngày trong một năm, với ~ 365 điểm dữ liệu.
  • Phía dưới bên trái. Theo tuần trong một năm, với ~ 52 điểm dữ liệu.
  • Phía dưới bên phải. Theo tháng trong một năm, với ~ 12 điểm dữ liệu.

Đầu vào tài

Người dùng có thể chọn:

  • loại chuỗi thời gian (giờ, hàng ngày, hàng tháng, hàng quý, hàng năm); và
  • ngày bắt đầu và ngày kết thúc cho chuỗi thời gian.

Ví dụ: người dùng có thể chọn báo cáo hàng ngày trong 30 ngày vào tháng 6.

Trend Trọng lượng

Để tính toán kích thước cửa sổ (ví dụ, số lượng các điểm dữ liệu đến trung bình khi tính đường xu hướng), biểu thức sau đây được sử dụng:

data points/trend weight 

đâu data points là bắt nguồn từ đầu vào của người dùng và trend weight6.4. Mặc dù trọng lượng xu hướng của 6.4 tạo ra sự phù hợp tốt, nó khá tùy ý và có thể không phù hợp với các đầu vào người dùng khác nhau.

Câu hỏi

Làm thế nào nên trend weight được tính cho những hạn chế của vấn đề này?

+1

Bạn có phù hợp với đường xu hướng hay chỉ tính trung bình di chuyển trong một cửa sổ và sau đó đặt một đường spline qua các giá trị? – Aniko

+1

Tôi tin rằng tôi đang theo sau một đường cong làm mịn. Http://en.wikipedia.org/wiki/Smoothing_spline –

Trả lời

1

Dựa trên ngoại hình của biểu đồ, tôi sẽ nói bạn có quá nhiều điểm cho biểu đồ 12 điểm của bạn (nó chỉ là một đường thẳng của t ông chỉ cho ... mà là trực quan dễ chịu, nhưng thực sự có hại nhiều hơn tốt khi cố gắng hiểu xu hướng) và quá ít điểm cho đồ thị điểm 365 của bạn. Có lẽ hãy thử làm một điều gì đó có một chút mũ như:

(Data points)^1.2/14.1 

Tôi nhận ra điều này thậm chí còn tùy ý hơn những gì bạn đã có, nhưng tùy ý không phải là điều tồi tệ nhất trên thế giới.

(Tôi có 14,1 bằng cách cố gắng để giữ cho đồ thị dưới 52 điểm cố định, vì đó là một vẻ đẹp, bằng cách lấy (52^(1.2)/52)*6.4=14.1. Bạn sử dụng kỹ thuật này, bạn có thể thử sức mạnh khác ngoài 1.2 để xem những gì bạn trực quan nhận được.

Dan

+0

Tôi có thể đã viết sai đề xuất của tôi sai. Tôi đang đề xuất tính toán kích thước cửa sổ thay thế. – Dan

0

Tôi đã bình chọn điều này cho chất lượng kết quả của bạn và độ rõ ràng của việc viết lên.Tôi ước tôi có thể đưa ra một câu trả lời có thể cải thiện công việc đã xuất sắc của bạn.

Tôi lo ngại rằng nó có thể là vấn đề thử và sai với trọng lượng xu hướng cho đến khi bạn thấy sự phù hợp được cải thiện.

Có thể là bạn cũng có thể tạo ra đầu vào này từ người dùng: cho phép chúng thích ứng với giá trị, với các ràng buộc thực tế, cho đến khi chúng nhận được các giá trị thỏa đáng.

Tôi cũng tự hỏi liệu trọng lượng có khác nhau đối với mỗi biểu đồ hay không, vì số điểm trong mỗi biểu đồ là khác nhau. Bạn đang cố gắng để có được một trọng số duy nhất mà làm việc cho tất cả các đồ thị?

Công việc tuyệt vời; một câu hỏi hay. Làm tốt. Tôi ước tôi hữu ích hơn. Có lẽ một người khác sẽ có trí huệ hơn để truyền đạt hơn tôi.

+0

Chỉ ra rằng "cách thực sự" để giải quyết vấn đề này sẽ có một cuốn sách để giải thích. Về cơ bản, mặc dù, nó liên quan đến việc gọi các hàm R trong cơ sở dữ liệu. sau đó thực hiện phân tích thống kê và cung cấp thêm cột dữ liệu cho báo cáo. Tính toán đường xu hướng trong iReport không phải là một ý tưởng tốt. –

+0

Tuyệt vời, tôi chắc chắn sẽ cho nó một cái nhìn. – duffymo

0

Có thể giống như các đường xu hướng là chính xác trong 4 biểu đồ đó nhưng thực sự khá rõ ràng. (Điều này được nhìn thấy rõ nhất trong việc cầu xin cái thấp nhất bên trái và phần đầu của phía trên bên phải. Tôi sẽ nghĩ rằng bạn sẽ muốn sử dụng không ít hơn một nửa số điểm của bạn khi tìm đường xu hướng (mặc dù thực sự bạn nên sử dụng nhiều hơn nữa hơn một nửa) Tôi sẽ đề nghị một Trọng lượng Xu hướng là 2 ở mức tối đa Mặc dù thực sự bạn phải gắn bó gần hơn với phạm vi 1-1.5. Vì nó là tùy ý tôi sẽ đề nghị bạn cung cấp cho người dùng của bạn một "độ chính xác của đường xu hướng" trượt mà họ có thể sử dụng nơi thiết lập chính xác nhất sử dụng trọng số xu hướng 1 và sử dụng chính xác ít nhất trọng lượng #of data points +1. Điều này sẽ sử dụng 0 điểm (vui cho bạn luôn tròn xuống) và tôi sẽ giả sử, mặc dù phần mềm thống kê của bạn có thể khác, sẽ tạo ra một đường ngang hẹp.

+0

Xin chào, David. Cảm ơn đã giúp đỡ. Do API, mỗi điểm dữ liệu phải trở thành một điểm trên đường xu hướng. Sử dụng trọng lượng xu hướng 2 sẽ không hoạt động. Lý do phía trên bên phải là tắt ngay từ đầu là bởi vì có rất ít điểm dữ liệu giữa tháng Giêng và tháng Ba, đó không phải là trường hợp với dữ liệu sản xuất. Tôi nghĩ về việc cho phép họ chọn một giá trị cho trọng lượng của đường xu hướng (với giá trị gợi ý), nhưng hy vọng có một số công thức mà tôi có thể áp dụng. –

+0

Trong một ở phía trên bên phải nó không giống như tắt của nó vì thiếu dữ liệu. Đường đi của nó quá cao mà không có dữ liệu để lấy nó ở đó. trong tháng đầu tiên của nó đạt đến đỉnh điểm trên mức tối đa cho tháng tiếp theo cũng như cao hơn mức trung bình của tháng tiếp theo.Tôi sẽ nghĩ rằng đường cong nên được dưới dòng màu xanh trong tháng đầu tiên kể từ khi không có dữ liệu trong tháng đó để kéo nó lên trên dòng màu xanh nhưng có dữ liệu trong tháng thứ hai để giữ nó xuống. – David

+0

Tôi bị sốc vì tôi đã từng biết bất kỳ điều gì về thống kê. Tôi không nhớ gì về điều này. – David