Tôi đang tìm cách chuyển đổi một vài đoạn văn và sắp xếp/sắp xếp thứ tự danh sách từ tệp MS Word thành HTML.Chuyển đổi văn bản MS Word thành html/css hợp lệ đơn giản
Bây giờ, vấn đề là khi lưu tệp Word dưới dạng tệp "htm/html" (tôi đang sử dụng Word 2010), tôi nhận được tấn của tất cả các loại chỉ thị CSS không mong muốn, một số là MS được phát minh và một số là CSS hợp lệ, mà tôi không muốn trong mã html của mình. Hơn nữa, và thậm chí còn có vấn đề hơn, các danh sách có thứ tự/không sắp xếp thậm chí không được mã hóa thành OL và UL với các mục LI, thay vì mã hóa Microsofty điên.
Ví dụ, một đoạn văn (Theo kiểu như "Bình thường" trong Word) được chuyển thành:
<p class=MsoNormal>
<span style='font-size:10.0pt;line-height:115%;mso-bidi-font-style:italic'>
bla bla </span></p>
Và tôi chỉ muốn nó rõ ràng là:
<p><span>bla bla</span></p>
khủng khiếp hơn, đơn giản danh sách chưa được xếp hạng ("danh sách có dấu đầu dòng") với một mục danh sách được chuyển đổi thành:
<p class=MsoListParagraph style='text-indent:-18.0pt;mso-list:l0 level1 lfo1'>
<![if !supportLists]>
<span style='font-family:Symbol;mso-fareast-font-family:Symbol;mso-bidi-font-family:Symbol'>
<span style='mso-list:Ignore'>·
<span style='font:7.0pt "Times New Roman"'>
</span></span></span><![endif]>
<span dir=LTR</span>Bla bla</p>
Trong khi tôi muốn nhận được:
<ul><li>Bla bla</li></ul>
Bất kỳ ý tưởng nào?
Cảm ơn bạn rất nhiều!
p.s. Tôi đang sử dụng Zend Studio (có thể có một công cụ chuyển đổi eclipse/zend-cụ thể được xây dựng hoặc một cái gì đó?)
p.s.p. Các tùy chọn MS Word duy nhất để xuất dưới dạng html tôi đã tìm thấy trong Options => Advanced => General => Web Options. Chơi với các tùy chọn này không giải quyết được bất kỳ vấn đề nào ở trên.
Sao chép mã và sau đó dán vào trình chỉnh sửa văn bản thuần túy như Văn bản tuyệt vời 2. –
@olwez Cảm ơn, tôi sẽ thử Sublime anyway (Mặc dù tôi thấy rằng nó sẽ yêu cầu giấy phép thanh toán trong tương lai) nhưng tôi đã tìm ra một giải pháp đơn giản, tôi sẽ viết nó như một câu trả lời. – Israel