2010-01-24 8 views
7

Tôi đang tìm kiếm một hướng dẫn để tải một tệp XML, đọc nó, thay đổi nó và cuối cùng lưu nó với C++. Tôi đang sử dụng Linux Ubuntu và đã cố gắng sử dụng Xerces. Với Google và nhiều thời gian, tôi chỉ có thể tải một Tệp XML:Xerces C++ - Tải, đọc và lưu, lựa chọn thay thế?

#include <xercesc/parsers/XercesDOMParser.hpp> 
#include <xercesc/dom/DOM.hpp> 
#include <xercesc/sax/HandlerBase.hpp> 
#include <xercesc/util/XMLString.hpp> 
#include <xercesc/util/PlatformUtils.hpp> 

#include <iostream> 

using namespace std; 
using namespace xercesc; 

int main (int argc, char* args[]) { 

    try { 
     XMLPlatformUtils::Initialize(); 
    } 
    catch (const XMLException& toCatch) { 
     char* message = XMLString::transcode(toCatch.getMessage()); 
     cout << "Error during initialization! :\n" 
      << message << "\n"; 
     XMLString::release(&message); 
     return 1; 
    } 

    XercesDOMParser* parser = new XercesDOMParser(); 
    parser->setValidationScheme(XercesDOMParser::Val_Always); 
    parser->setDoNamespaces(true); // optional 

    ErrorHandler* errHandler = (ErrorHandler*) new HandlerBase(); 
    parser->setErrorHandler(errHandler); 

    const char* xmlFile = "demo.xml"; 

    try { 
     parser->parse(xmlFile); 
    } 
    catch (const XMLException& toCatch) { 
     char* message = XMLString::transcode(toCatch.getMessage()); 
     cout << "Exception message is: \n" 
      << message << "\n"; 
     XMLString::release(&message); 
     return -1; 
    } 
    catch (const DOMException& toCatch) { 
     char* message = XMLString::transcode(toCatch.msg); 
     cout << "Exception message is: \n" 
      << message << "\n"; 
     XMLString::release(&message); 
     return -1; 
    } 
    catch (...) { 
     cout << "Unexpected Exception \n" ; 
     return -1; 
    } 

    DOMNode* docRootNode; 
// DOMNode* aNode; 
    DOMDocument* doc; 
    doc = parser->getDocument(); 
    docRootNode = doc->getDocumentElement(); 
    cout << docRootNode->getAttributes() << endl; //returns Hex 



    delete parser; 
    delete errHandler; 
    return 0; 
} 

Làm cách nào để có thể đọc thao tác tệp XML và lưu cuối cùng? Có thư viện thay thế nào không? (Tôi đã thử tinyxml nhưng các tệp trả về lỗi, khi tôi muốn biên dịch nó)

+0

Tôi hy vọng bạn sử dụng Xerces mới 3. * 2.7/2.8 cũ đang bị rò rỉ bộ nhớ khắp nơi –

Trả lời

1

LibXML ++ dường như là tốt nhất cho C++. Tính năng này rất hoàn chỉnh, bao gồm XPath, chuyển đổi ký tự (bởi Glibmm) và mọi thứ bạn mong đợi trong một thư viện XML. Nó sử dụng các API DOM và SAX truyền thống, được tính là chuyên nghiệp hoặc con tùy thuộc vào người bạn yêu cầu. Một vấn đề có thể xảy ra là các phụ thuộc của thư viện rất nặng (do sử dụng Glibmm). Tuy nhiên, nó dường như là thư viện XML phong nha duy nhất cho C++.

http://libxmlplusplus.sourceforge.net/docs/manual/html/index.html

TinyXML không phân tích cú pháp XML theo đặc điểm kỹ thuật, vì vậy tôi muốn giới thiệu chống lại nó, mặc dù nó hoạt động cho văn bản đơn giản.

0

Mẫu CreateDOMDocument đi kèm với Xerces chỉ cho bạn cách thêm nút v.v. vào tài liệu DOM. Mã bạn có cho đến nay tạo ra các tài liệu, vì vậy bạn cần phải sửa lại mã trong mẫu thứ hai để thêm các nút, các thuộc tính, vv

Ngoài ra, lưu ý rằng khi bạn nói:

cout << docRootNode->getAttributes() << endl; 

các getAttributes chức năng trả về một tập hợp các thuộc tính - bạn cần phải áp dụng các hàm Xerces nữa cho bộ sưu tập đó để lấy thông tin chứa. Lưu ý rằng nếu bạn muốn trích xuất một tập hợp con của dữ liệu trong tệp XML, có thể dễ dàng hơn khi sử dụng trình phân tích cú pháp SAX theo sự kiện (Xerces bao gồm một trong số này) thay vì xây dựng và đi bộ một tài liệu DOM hoàn chỉnh.

0

Nếu bạn muốn xem một ví dụ về làm thế nào để làm điều đó bằng Xerces-C++, hãy kiểm tra mã này:

http://libprf1.tigris.org/files/documents/1338/13256/libprf1-0.1R3.tar.gz

Tôi đã viết nó trong một thời gian dài trước đây như là một dự án trường đại học. Nó rất có thể dựa trên một phiên bản lỗi thời của Xerces-C++, nhưng tôi không nghĩ rằng API đã thay đổi quá nhiều để trở thành một vấn đề. Nó sẽ ít nhất cung cấp cho bạn một ý tưởng.

2

Mẫu để lưu tài liệu DOM xerces. Lưu một tài liệu với

DOMLSSerializer::write(const DOMNode* nodeToWrite, DOMLSOutput* const destination) 

xem mã Ví dụ http://xerces.apache.org/xerces-c/domprint-2.html

DOMLSSerializer * theSerializer = impl->createLSSerializer(); 
    DOMPrintFilter *myFilter = new DOMPrintFilter(DOMNodeFilter::SHOW_ELEMENT | 
             DOMNodeFilter::SHOW_ATTRIBUTE | 
             DOMNodeFilter::SHOW_DOCUMENT_TYPE); 
    theSerializer->setFilter(myFilter); 

    DOMLSOutput  *theOutputDesc = ((DOMImplementationLS*)impl)->createLSOutput(); 
    XMLFormatTarget *myFormTarget = new LocalFileFormatTarget(XMLString::transcode("C:\\target.xml")); 
    theOutputDesc->setByteStream(myFormTarget); 
    theOutputDesc->setEncoding(XMLString::transcode("ISO-8859-1")); 

    theSerializer->getDomConfig()->setParameter(XMLUni::fgDOMXMLDeclaration, true); 

    theSerializer->getDomConfig()->setParameter(XMLUni::fgDOMWRTFormatPrettyPrint, true); 
    theSerializer->write(doc, theOutputDesc); 

    myFormTarget->flush(); 

    delete myFormTarget; 

    theOutputDesc->release(); 
    theSerializer->release(); 

Và một ví dụ để thực hiện Filter. Bạn có thể tìm thấy điều này trong ví dụ DOMPrint.

class DOMPrintFilter : public DOMLSSerializerFilter { 
public: 

    DOMPrintFilter(ShowType whatToShow = DOMNodeFilter::SHOW_ALL); 
    ~DOMPrintFilter(){}; 

    virtual FilterAction acceptNode(const DOMNode*) const; 
    virtual ShowType getWhatToShow() const {return fWhatToShow;}; 

private: 
    // unimplemented copy ctor and assignement operator 
    DOMPrintFilter(const DOMPrintFilter&); 
    DOMPrintFilter & operator = (const DOMPrintFilter&); 

    ShowType fWhatToShow; 
}; 
#include "DOMPrintFilter.hpp" 
#include <xercesc/util/XMLUniDefs.hpp> 
#include <xercesc/util/XMLString.hpp> 

static const XMLCh element_person[]= 
{ 
chLatin_p, chLatin_e, chLatin_r, chLatin_s, chLatin_o, chLatin_n, chNull 
}; 

static const XMLCh element_link[]= 
{ 
chLatin_l, chLatin_i, chLatin_n, chLatin_k, chNull 
}; 

DOMPrintFilter::DOMPrintFilter(ShowType whatToShow) 
:fWhatToShow(whatToShow) 
{} 

DOMNodeFilter::FilterAction DOMPrintFilter:: 
acceptNode(const DOMNode* node) const 
{ 
// 
// The DOMLSSerializer shall call getWhatToShow() before calling 
// acceptNode(), to show nodes which are supposed to be 
// shown to this filter. 
// 
// REVISIT: In case the DOMLSSerializer does not follow the protocol, 
//   Shall the filter honour, or NOT, what it claims 
//   it is interested in ? 
// 
// The DOMLS specs does not specify that acceptNode() shall do 
// this way, or not, so it is up the implementation, 
// to skip the code below for the sake of performance ... 
// 
if ((getWhatToShow() & (1 << (node->getNodeType() - 1))) == 0) 
    return DOMNodeFilter::FILTER_ACCEPT; 

switch (node->getNodeType()) 
{ 
case DOMNode::ELEMENT_NODE: 
    { 
     // for element whose name is "person", skip it 
     if (XMLString::compareString(node->getNodeName(),   element_person)==0) 
      return DOMNodeFilter::FILTER_SKIP; 
     // for element whose name is "line", reject it 
     if (XMLString::compareString(node->getNodeName(), element_link)==0) 
      return DOMNodeFilter::FILTER_REJECT; 
     // for rest, accept it 
     return DOMNodeFilter::FILTER_ACCEPT; 

     break; 
    } 
case DOMNode::COMMENT_NODE: 
    { 
     // the WhatToShow will make this no effect 
     return DOMNodeFilter::FILTER_REJECT; 
     break; 
    } 
case DOMNode::TEXT_NODE: 
    { 
     // the WhatToShow will make this no effect 
     return DOMNodeFilter::FILTER_REJECT; 
     break; 
    } 
case DOMNode::DOCUMENT_TYPE_NODE: 
    { 
     // even we say we are going to process document type, 
     // we are not able be to see this node since 
     // DOMLSSerializerImpl (a XercesC's default implementation 
     // of DOMLSSerializer) will not pass DocumentType node to 
     // this filter. 
     // 
     return DOMNodeFilter::FILTER_REJECT; // no effect 
     break; 
    } 
case DOMNode::DOCUMENT_NODE: 
    { 
     // same as DOCUMENT_NODE 
     return DOMNodeFilter::FILTER_REJECT; // no effect 
     break; 
    } 
default : 
    { 
     return DOMNodeFilter::FILTER_ACCEPT; 
     break; 
    } 
} 

return DOMNodeFilter::FILTER_ACCEPT; 
} 
+0

Điều này đã giúp tôi vì xerces là không phát hành tệp của tôi vì tôi không xóa bỏ hoặc xóa XMLFormatTarget. – jacobsgriffith

0

Liên kết sau là hướng dẫn hữu ích cho thấy cách cơ bản về cách đọc tệp XML và phân tích cú pháp bằng XERCES.

http://www.yolinux.com/TUTORIALS/XML-Xerces-C.html

Khi điều đó được thực hiện, API Xerces nên là đủ cho các hoạt động tiếp tục:

http://xerces.apache.org/xerces-c/apiDocs-2/classes.html

Đối với văn bản (serialize) tài liệu, sử dụng lớp DOMWriter http://xerces.apache.org/xerces-c/apiDocs-2/classDOMWriter.html#a0ddcef5fed6b49e03e53334fedca4b2