Đây là điều tôi đã cố gắng làm trong một thời gian và là một câu hỏi mở kết thúc. Nếu bất cứ ai có bất kỳ kiến thức nào có thể giúp tôi làm sáng tỏ điều này, nó sẽ được đánh giá rất cao.Phân tích cú pháp Mp3 trong Python
Tôi muốn giải mã luồng âm thanh bằng mp3 và sử dụng để truyền hoạt ảnh, tất cả đều sử dụng python. Theo tôi hiểu, dữ liệu âm thanh trong mp3 được lưu trong khung 32 băng tần (hoặc tần số thùng), lý tưởng cho tôi - nếu tôi có thể lấy mp3 và trích biên độ cho mỗi băng con trên mỗi khung, hoàn hảo cho những gì tôi muốn làm.
Tôi tìm thấy giải pháp ở đây https://bitbucket.org/portalfire/pymp3 nơi tất cả quá trình xử lý dường như được thực hiện trong python. Nó khá chậm, nhưng ngay cả khi tôi có thể sử dụng để trích xuất những gì tôi muốn, nó sẽ là tốt - Tôi đang đấu tranh để hiểu những gì đang xảy ra trong mã đó mặc dù. Tôi cũng đã có một giải pháp mà tôi chuyển đổi sang wav và sau đó sử dụng fft để trích xuất tần số từ wav. Điều này là rất ồn ào và có vẻ như một cách ngu ngốc để làm điều đó như dữ liệu tôi muốn được lưu trữ trực tiếp trong mp3 - chuyển đổi trở lại một làn sóng âm thanh có vẻ không cần thiết. Điều này thực sự nhanh hơn cái đầu tiên. Đây là những gì tôi đã kết thúc với:
http://www.youtube.com/watch?v=f_0FORxlK4A
Vâng nếu có ai có lời khuyên nào, hay kinh nghiệm mà họ muốn chia sẻ, hay ý tưởng cho các thư viện tôi nên nhìn vào, tôi thực sự muốn nghe.
Cảm ơn!
Henry
Bạn có thể xem qua http://wiki.python.org/moin/PythonInMusic một lần để xem một bộ thư viện khổng lồ có sẵn ở đó –
Có một số thư viện MP3 ở ngoài đó và yêu cầu đề xuất mà một trong những sử dụng là chính xác loại điều mà một câu hỏi và câu trả lời diễn đàn như SO là xấu lúc xử lý. – abarnert
Một lời khuyên tôi có thể đưa ra: Nếu bạn biết cách sử dụng cython, ctypes hoặc bất kỳ cơ chế nào khác, bạn nên xem các thư viện C như mpg123 không có bất kỳ ràng buộc Python nào và chỉ gói các bit mà bạn cần . Bạn có nhiều lựa chọn hơn theo cách đó. – abarnert