Tôi đang cố gắng thực hiện một số công việc dữ liệu trong gấu trúc Python và gặp khó khăn khi viết kết quả của mình. Tôi đọc dữ liệu của mình dưới dạng tệp CSV và xuất mỗi tập lệnh dưới dạng tệp CSV của chính nó hoạt động tốt. Gần đây mặc dù tôi đã cố gắng xuất khẩu tất cả mọi thứ trong 1 tập tin Excel với bảng tính và một vài trong số các tờ cho tôi một lỗiCodec Python to_excel 'utf8' codec không thể giải mã byte
" 'utf8' giải mã không thể giải mã byte 0xe9 ở vị trí 1: byte tiếp tục không hợp lệ"
Tôi không biết làm thế nào để bắt đầu tìm kiếm bất kỳ ký tự nào có thể gây ra sự cố khi xuất sang Excel. Bạn không chắc chắn lý do tại sao nó xuất khẩu sang CSV tốt mặc dù :(
dòng có liên quan
from pandas import ExcelWriter
data = pd.read_csv(input)
writer = ExcelWriter(output) #output is just the filename
fundraisers.to_excel(writer, "fundraisers")
locations.to_excel(writer, "locations") #error
locations.to_csv(outputcsv) #works
writer.save()
in đứng đầu vi phạm dataframe
Event ID Constituent ID Email Address First Name \ Last Name
f 1 A A 1
F 4 L R C
M 1 1 A D
F 4 A A G
M 2 0 R G
M 3 O O H
M 2 T E H
M 2 A A H
M 2 M M K
F 3 J E K
Location ID raised raised con raised email
a 0 0 0
a 8 0 0
o 0 0 0
o 0 0 0
o 0 0 0
t 5 0 0
o 1 0 0
o 6 a 0
o 6 0 0
d 0 0 0
nhìn vào bảng excel tôi thực sự có được một bản in từng phần ra Bất cứ điều gì trong cột tên đầu tiên và xa hơn là trống, nhưng sự kiện, thành phần và email tất cả các bản in. nó trong latin1 hoạt động. Có cách nào để chỉ định mã hóa to_excel không? Hoặc giải mã và mã hóa dataframe của tôi thành utf8?
Bạn có thể đăng một số ký tự unicode có thể vi phạm của bạn không? Tạo ra các ký tự ngẫu nhiên tiếng Do Thái và sau đó viết chúng hoạt động ổn cho tôi. –
Tôi không biết làm thế nào để tìm ra nhân vật mà nó thấy xúc phạm. – Wizuriel
Một lý do khiến CSV khác nhau là do việc xuất Excel không được thực hiện bởi 'pandas' nó được thực hiện bởi các thư viện của bên thứ ba (' xlwt' và/hoặc 'openpyxl'). –