Dưới đây là thông điệp Twitter Tôi cố gắng để phân tích cú pháp (như bạn có thể thấy, một số trong số này là không thẻ, chỉ là một phần của URL):Regular Expression cho Parsing hashtags trong Java
#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John
Nack on &#Adobe: Information about Photoshop© CS3 on Snow Leopard
#fail #design</pre>
biểu thức chính quy này là những gì tôi có cho đến nay, nhưng nó vẫn chọn một số thẻ url:
[##]+([A-Za-z0-9-_]+)
Vậy chính xác bạn đang cố gắng làm gì? Bạn có thể cung cấp kết quả mong đợi không? – serg
Xin lỗi, tôi nên rõ ràng hơn. Tôi đang cố gắng làm một trận đấu để tìm thấy tất cả các thẻ trong một tweet đã cho. Tôi hy vọng rằng các tweet từ phía trên sẽ trả về 'anothertag', 'fail' và 'design'. –
Bạn đã thử cái này chưa? http://stackoverflow.com/questions/1563844/best-hashtag-regex/5768660#5768660 Cung cấp regex cung cấp dựa trên mã của Twitter và nếu tôi đọc đúng, nó đảm bảo rằng thông báo không bắt đầu bằng dấu thăng. Nếu bạn muốn vô hiệu hóa, bạn có thể loại bỏ nhóm dấu ngoặc đơn đầu tiên. Nên đề cập đến rằng tôi đã không được thử nghiệm này regex cá nhân mặc dù :) – johncip