tokenize

    7Nhiệt

    6Trả lời

    Tôi có chuỗi như thế này /c SomeText\MoreText "Some Text\More Text\Lol" SomeText Tôi muốn tokenize nó, tuy nhiên tôi không thể chỉ chia trên không gian. Tôi đã nghĩ ra một trình phân tích cú pháp hơ

    15Nhiệt

    4Trả lời

    Tôi biết có token token nhưng có một "int tokenizer"? Ví dụ, tôi muốn chia chuỗi "12 34 46" và có: danh sách [0] = 12 danh sách [1] = 34 danh sách [2 ] = 46 Đặc biệt, tôi tự hỏi liệu Boost :: Tokenize

    5Nhiệt

    3Trả lời

    Tôi có một chuỗi khá đơn giản mà tôi muốn phân tích bằng ruby ​​và cố gắng tìm ra giải pháp thanh lịch nhất. Chuỗi là định dạng /xyz/mov/exdaf/daeed.mov?arg1=blabla & arg2 = 3bla3bla Những gì tôi muốn

    9Nhiệt

    5Trả lời

    Tôi đang cố gắng tìm hiểu bản thân một số C++ từ đầu tại thời điểm này. Tôi rất thành thạo trong python, perl, javascript nhưng chỉ gặp C++ trong một thời gian ngắn, trong một khung cảnh lớp học trong

    37Nhiệt

    9Trả lời

    Tôi đã quen với kiểu c getchar() c, nhưng có vẻ như không có gì so sánh được với java. Tôi đang xây dựng một máy phân tích từ vựng, và tôi cần đọc ký tự đầu vào theo ký tự. Tôi biết tôi có thể sử dụng

    9Nhiệt

    11Trả lời

    Tôi muốn tokenize một chuỗi như thế này String line = "a=b c='123 456' d=777 e='uij yyy'"; tôi không thể chia nhỏ các căn cứ như thế này String [] words = line.split(" "); ý tưởng Bất kỳ làm thế n

    7Nhiệt

    6Trả lời

    Tôi có một chuỗi đó là như thế này: đây là [thử nghiệm khung] "và trích dẫn test" Tôi đang cố gắng để viết một cái gì đó bằng Python để tách nó ra bởi không gian trong khi bỏ qua dấu cách trong dấu ng

    12Nhiệt

    12Trả lời

    Tôi sẽ thực hiện một tokenizer trong Python và tôi đã tự hỏi nếu bạn có thể cung cấp một số lời khuyên phong cách? Tôi đã triển khai trình mã thông báo trước trong C và Java nên tôi ổn với lý thuyết,

    5Nhiệt

    2Trả lời

    Làm thế nào để có được những kết quả tương tự như http://developer.yahoo.com/search/content/V1/termExtraction.html Câu hỏi này đã được yêu cầu khá một vài lần trước đó. best approach to analyze text i

    12Nhiệt

    3Trả lời

    Tôi có chuỗi này: %{Children^10 Health "sanitation management"^5} Và tôi muốn chuyển nó sang tokenize này vào một mảng băm: [{:keywords=>"children", :boost=>10}, {:keywords=>"health", :boost=>nil},