Tôi hy vọng tôi đang diễn đạt điều này một cách chính xác để vượt qua những gì tôi đang tìm kiếm.Làm thế nào để xác định một chuỗi dna cho giống với một số khác
Tôi cần so sánh hai phần văn bản. Nếu hai dây giống nhau, tôi muốn có điểm số rất giống nhau nếu các dây rất khác nhau, tôi cần điểm số rất khác nhau.
Nếu tôi lấy hàm băm md5 của một email và thay đổi một ký tự, giá trị băm thay đổi đáng kể Tôi muốn một cái gì đó không thay đổi quá nhiều. Tôi cần so sánh hai phần nội dung giống nhau như thế nào mà không lưu trữ chuỗi.
Cập nhật: Tôi đang xem xét kết hợp một số ý tưởng từ các liên kết khác nhau mà mọi người đã cung cấp. Lý tưởng nhất là tôi sẽ thích một hàm đầu vào đơn lẻ để tạo ra điểm số của mình vì vậy tôi đang xem xét việc sử dụng một chuỗi tham chiếu để luôn so sánh đầu vào của mình. Tôi cũng đang xem xét các ký tự asci và tổng hợp các ký tự này. Vẫn đọc tất cả các liên kết được cung cấp.
Bạn có ý nghĩa gì với "điểm số"? Bạn có nghĩa là một thứ hạng của các chuỗi gần nhau như thế nào? Nhưng đoạn thứ ba của bạn có vẻ giống như bạn đang tìm kiếm giá trị băm giống với những thay đổi nhỏ ("băm mạnh mẽ" là thuật ngữ cho các công cụ như vậy, thường được sử dụng cho âm thanh và hình ảnh nhiều hơn dây.) – SPWorley