2010-01-28 16 views
14

Có bất kỳ thuật toán nào để chuyển đổi video 2D thành video 3D (để xem bằng kính) không?Có bất kỳ thuật toán nào để chuyển đổi video 2D thành video 3D không?

(A-la quay Avatar thành Avatar cho một trải nghiệm IMAX 3D.) Hoặc ít nhất biến nó thành hình chuẩn bị cho cảm giác một số chế độ xem 3D sử dụng nó một-la:

Alt text http://www.3dglassesonline.com/how-do-3d-glasses-work/3-d-glasses-traditional.gif

hoặc

Alt text http://www.3dglassesonline.com/how-do-3d-glasses-work/3-d-glasses-polarization-new.gif

+0

có thể đang sử dụng các tiêu chuẩn để tạo ra thứ gì đó như trải nghiệm 3D? – Rella

+0

có vẻ như ý tưởng về các phương pháp tự động tô màu cho phim đen trắng của ngày cũ. đó là một ý kiến ​​hay. – darlinton

Trả lời

2

Bạn có lẽ nên hiểu sự khác biệt giữa kính phân cực và kính màu đỏ/xanh lam. Hiệu ứng 3D kính màu đỏ/xanh rất đơn giản. Bạn chỉ cần chụp một bức ảnh cách nhau vài inch (loại giống như mắt được đặt ra) và chồng lên nhau từng ảnh. Có hướng dẫn về cách thực hiện việc này trong Making Anaglyph Images in Adobe Photoshop.

Đối với hiệu ứng kính phân cực, điều này khó hơn một chút. Nếu bạn đi đến một rạp chiếu phim và xem một bộ phim 3D với kính phân cực, bạn sẽ thấy 3D thực sự. Nó hoạt động bằng cách có hai máy chiếu. Một máy chiếu đang chiếu phim theo một loại phân cực và máy chiếu thứ hai chiếu phim ở loại phân cực khác. Những hình ảnh được phủ lên nhau trên đầu trang của nhau vì vậy nếu bạn đang đeo kính phân cực 3D của bạn, nó sẽ xuất hiện ở dạng 3D.

Điều này không thể thực hiện dễ dàng với TV hoặc màn hình máy tính. TV hoặc màn hình của bạn sẽ phải chiếu đồng thời hai hình ảnh. Do sự phổ biến của 3D bây giờ mặc dù, có TV 3D và màn hình xuất hiện trên thị trường mà không dự án hai hình ảnh, nhưng hiển thị 3D.Dưới đây là cách chúng hoạt động:

Màn hình máy tính thông thường hoặc TV làm mới ở tần số 60   Hz. Điều này có nghĩa là 60 lần trong một giây, hình ảnh bạn thấy đang được làm mới. Bởi vì nó quá nhanh, mắt người không thấy nhấp nháy. TV 3D và màn hình làm mới ở 120   Hz. Hình ảnh phân cực là các trao đổi với tốc độ 120 lần mỗi giây, nhưng vì có hai hình ảnh, nó xuất hiện ở 60 lần một giây, đó là những gì tạo ra hiệu ứng 3D.

Tôi hy vọng điều này sẽ giúp bạn hiểu một chút.

Để trả lời câu hỏi của bạn, có, bạn có thể tạo video 3D nhưng bạn cần có màn hình 3D và TV 3D để xem.

3

Không thực sự. Liệu thuật toán có hiểu được nội dung cảnh và ngoại suy thông tin sâu từ đó không? Hãy nhớ rằng video 3D cần thông tin chuyên sâu. Nếu không thì không có cách nào biết được có bao nhiêu bù đắp cho hai phần khung.

Bạn có thể thử bằng cách chỉ định các độ sâu khác nhau cho các mức độ khác nhau của việc không tập trung nhưng tôi nghi ngờ điều gì đó có thể sử dụng sẽ xuất hiện.

4

Không - Video 3D yêu cầu có thêm thông tin (chiều sâu) không có trong video 2D.

Nếu bạn có một kết xuất 2D của sceene (ví dụ trong Toy Story) thì khá dễ dàng để tạo phim 3D - bạn chỉ cần thay đổi góc nhìn của sceene và tái render.

+0

hiển thị s/2D/mô tả cảnh 3D/ – Joey

+2

Vâng, con người có thể đánh giá độ sâu khi họ xem phim 2D, vì vậy thông tin * là * ở đó. Nó chỉ là rất khó để viết một thuật toán có thể giải nén nó. – Niki

13

Vâng, Stanford có an algorithm for converting 2D photos into 3D models. Tôi đoán là với các bộ phim, việc này sẽ dễ dàng hơn, bởi vì sau đó bạn có một số ảnh thay vì chỉ một, vì vậy bạn có thể trích xuất nhiều thông tin hơn về chiều sâu bằng cách so sánh các khung lân cận.

Có thể cho rằng, kết quả sẽ không bao giờ khá tốt như khi bạn chỉ hiển thị/quay phim ở chế độ 3D để bắt đầu.

+1

Nghiên cứu tương tự có thể được tìm thấy, ví dụ: ở đây: http://www.mpi-inf.mpg.de/~thormae/paper/Siggraph08_orthoimage.pdf –

1

Trên chương trình CES năm nay, Toshiba trình bày màn hình TV-cell và họ tuyên bố rằng nó có thể chuyển đổi tín hiệu TV 2D thành 3D. Tôi không biết nếu nó tạo ra một kết quả tốt hay những thuật toán mà họ đang sử dụng, nhưng nếu họ là sự thật phải có một thuật toán cho việc này.

Nhưng không may, tôi không biết làm thế nào nó có thể được thực hiện.

1

Ví dụ: có các thuật toán hiện có để trích xuất hình dạng 3D từ hình ảnh 2D, here hoặc here. Bạn có thể trích xuất hình dạng từ mỗi khung hình của video và thậm chí sử dụng nhiều khung hình để hiểu rõ hơn về hình dạng bằng cách phát hiện chuyển động của chúng.

Tuy nhiên, tỷ lệ cược là kết quả sẽ không ở đâu gần chất lượng chuẩn của nội dung của phim 3D.

2

Không có thuật toán riêng lẻ cho mỗi lượt nói, nhưng có, có thể. Cái này khó quá. Có những người làm việc về vấn đề này ngay bây giờ. Các thuật toán liên quan rất khó để viết, chúng không phải lúc nào cũng hoạt động đúng, và bất kỳ giải pháp hoàn chỉnh nào cũng sẽ đòi hỏi một lượng lớn sức mạnh xử lý. Bất kỳ giải pháp nào sẽ ngoại tuyến (thay vì thời gian thực) lúc đầu.

Nhận thức 3D không được gắn chặt chẽ với quang học âm thanh nổi như bạn có thể tin. Nếu bạn nghĩ rằng bạn cần hai mắt để xem 3D, sau đó thử đi bộ xung quanh với một cái băng bịt mắt. Bạn sẽ làm tốt. Có một số (nhỏ) các chương trình trên mạng, bao gồm một số gói phần mềm thương mại, tạo ra các mô hình 3D từ bộ ảnh 2D mà không có máy ảnh stereo. Một số hoạt động trực tuyến, xây dựng một mô hình chi tiết hơn vì nó được xem nhiều hơn.

Chỉ cần suy nghĩ về điều đó, tôi có thể nghĩ về một số vấn đề mà bạn gặp phải với phim nói riêng. Ví dụ, tôi có thể tưởng tượng Matt được kết xuất ở độ sâu không chính xác. Video có hiệu ứng đặc biệt từ phần mềm như Apple Motion có thể kết thúc với các đồ tạo tác lạ.

4

Nó không thể hoạt động nói chung vì một lý do rất đơn giản: Giả sử bạn có cảnh có cửa sổ trên tường hiển thị bãi biển và bên cạnh đó, bạn có ảnh hiển thị cửa sổ trên tường hiển thị bãi biển. Làm thế nào thuật toán có thể phân biệt giữa hai? Làm thế nào bạn có thể phát hiện thực tế là gì với chiều sâu và cái gì chỉ là một bức ảnh phẳng?

+0

Ví dụ của bạn là một ví dụ hoàn hảo. Dễ dàng giải thích tại sao điều này có thể không bao giờ thực sự hoạt động hoàn hảo. – Beska

2

Có thể sẽ có một thuật toán để mô phỏng các khung nhìn lập thể, nhưng nó không thể giống nhau.

Lý do khá đơn giản. Trong một video 2D không chỉ thiếu thông tin chiều sâu (mà không đủ để nhận được một video lập thể), nhưng nó thiếu các bề mặt ẩn mà có thể nhìn thấy từ một quan điểm khác.

Mọi người đều có thể nghĩ rằng thông tin chuyên sâu có thể được ngoại suy từ thông tin có sẵn và điều này là đúng. Tuy nhiên, thông tin còn thiếu không thể chính xác để có hiệu ứng lập thể tốt.

Ngoài ra, tôi đã nghe nói về một hệ thống mà coudl trích xuất các mô hình 3D chính xác từ 8 (tám!) Máy ảnh chỉ trên cùng một mục tiêu. Nó là rất chính xác để thi đua cũng quần áo chuyển động một cách chính xác. Tuy nhiên, điều này được thực hiện xử lý 8 (tám!) Video 2D. Làm cách nào để có thể đạt được kết quả tương tự chỉ với một video 2D?

Kết quả đạt được của kết quả mong muốn phụ thuộc chủ yếu bởi tính khả dụng của thông tin và trong trường hợp này (IMHO) không có thông tin đủ. Mặc dù vậy, có thể thử giả lập hiệu ứng lập thể từ một video 2D, nhưng về cơ bản nó cần một công việc khó khăn, xử lý lâu dài và hậu quả là kết quả chất lượng thấp tôn trọng một video lập thể ban đầu.


Tôi muốn nhớ rằng chế độ xem 3D được tạo ra bởi bộ não của chúng tôi. Đôi mắt chỉ có thể chụp hình ảnh 2D, và bộ não của chúng ta, xử lý hai hình ảnh có thể tạo ra một cái nhìn sâu sắc về các vật thể nhìn thấy.