Java中字符串海明距离计算与列表匹配教程

作者 2025年8月30日 9

本文详细介绍了如何在Java中计算两个字符串的海明距离，并处理长度不匹配的情况。教程将指导读者实现一个程序，该程序能够从用户输入中获取一个字符串列表和一个目标字符串，计算列表中每个字符串与目标字符串的海明距离，最终找出并显示最短海明距离及其对应的字符串。

1. 海明距离概述

海明距离（hamming distance）是两个等长字符串之间对应位置上不同字符的数量。它广泛应用于错误检测、编码理论以及生物信息学等领域。例如，字符串”karolin”和”kathrin”的海明距离是3（o与t，l与h，i与i相同，但r与r相同，n与n相同）。如果两个字符串的长度不相等，则它们的海明距离通常被认为无法计算或定义为某个特定值（例如-1）。

2. 实现海明距离计算方法

我们将创建一个名为 hamming 的静态方法，它接收两个字符串作为参数，并返回它们的海明距离。

2.1 方法定义与逻辑

参数: 两个字符串，例如 s1 和 s2。
返回值: 一个整数，表示海明距离。
核心逻辑:
- 首先，检查 s1 和 s2 的长度是否相等。如果不相等，根据要求返回 -1。
- 如果长度相等，则遍历字符串的每个位置，比较对应字符。每当字符不相同时，将距离计数器加一。
- 遍历结束后，返回最终的距离计数。

2.2 示例代码：hamming 方法

public static int hamming(String s1, String s2) {     // 检查字符串长度是否相等，不相等则返回-1     if (s1.length() != s2.length()) {         return -1;     }      int distance = 0;     // 遍历字符串，比较对应位置的字符     for (int i = 0; i < s1.length(); i++) {         if (s1.charAt(i) != s2.charAt(i)) {             distance++; // 字符不同，距离加1         }     }     return distance; }

3. 主程序逻辑实现：main 方法

main 方法将负责处理用户输入、调用 hamming 方法计算距离、存储结果，并最终找出并显示最短距离。

3.1 变量初始化

我们需要一个字符串数组 stringList 来存储用户输入的5个字符串，以及一个整数数组 distances 来存储每个字符串与目标字符串的海明距离。

import java.util.Scanner; import java.util.Arrays; // 用于打印数组  public class HammingDistanceCalculator {      public static void main(String[] args) {         Scanner scanner = new Scanner(System.in);          // 定义存储5个字符串的数组         String[] stringList = new String[5];         // 定义存储5个海明距离的数组         int[] distances = new int[5];          // ... (后续代码)     }      // ... (hamming 方法) }

3.2 读取用户输入

程序将首先提示用户输入5个字符串，然后输入一个目标字符串。

立即学习“Java免费学习笔记（深入）”；

        // 读取5个字符串到stringList数组         System.out.println("请输入5个字符串：");         for (int i = 0; i < 5; i++) {             System.out.print((i + 1) + ". Enter string: ");             stringList[i] = scanner.nextLine();         }          // 读取目标字符串         System.out.print("Enter target: ");         String target = scanner.nextLine();

3.3 计算并存储海明距离

使用循环遍历 stringList 数组，对每个字符串调用 hamming 方法，并将返回的距离存储到 distances 数组中。

        // 计算每个字符串与目标字符串的海明距离         for (int i = 0; i < 5; i++) {             distances[i] = hamming(target, stringList[i]);         }

3.4 查找最短海明距离

遍历 distances 数组，找出其中最小的非负距离。同时，需要记录下与最短距离对应的字符串在 stringList 中的索引。如果所有距离都是 -1，则表示没有找到有效的海明距离。

        int minDistance = Integer.MAX_VALUE; // 初始化为最大值         int minDistanceIndex = -1;           // 记录最短距离的索引          // 查找最短海明距离         for (int i = 0; i < 5; i++) {             // 忽略-1（表示长度不匹配）             if (distances[i] != -1) {                 if (distances[i] < minDistance) {                     minDistance = distances[i];                     minDistanceIndex = i;                 }             }         }

3.5 显示结果

最后，程序将打印 distances 数组的所有内容，并根据找到的最短距离显示相应的字符串。

        // 显示distances数组内容         System.out.println("Contents of array distances:");         // 按照示例格式输出         for (int i = 0; i < 5; i++) {             System.out.println(i + " " + distances[i]);         }          // 显示最短距离对应的字符串         if (minDistanceIndex != -1) {             System.out.println("String with min Hamming distance: " + stringList[minDistanceIndex] + ".");         } else {             System.out.println("No Hamming distance found");         }          scanner.close(); // 关闭Scanner

4. 完整的程序代码

将上述所有部分整合到一个Java类中，即可得到完整的解决方案。

import java.util.Scanner; import java.util.Arrays; // 用于打印数组，尽管本例中手动循环打印  public class HammingDistanceCalculator {      /**      * 计算两个字符串的海明距离。      * 如果字符串长度不相等，则返回-1。      *      * @param s1 第一个字符串      * @param s2 第二个字符串      * @return 海明距离，如果长度不匹配则返回-1      */     public static int hamming(String s1, String s2) {         // 检查字符串长度是否相等         if (s1.length() != s2.length()) {             return -1;         }          int distance = 0;         // 遍历字符串，比较对应位置的字符         for (int i = 0; i < s1.length(); i++) {             if (s1.charAt(i) != s2.charAt(i)) {                 distance++; // 字符不同，距离加1             }         }         return distance;     }      public static void main(String[] args) {         Scanner scanner = new Scanner(System.in);          // 定义存储5个字符串的数组         String[] stringList = new String[5];         // 定义存储5个海明距离的数组         int[] distances = new int[5];          // 读取5个字符串到stringList数组         System.out.println("请输入5个字符串：");         for (int i = 0; i < 5; i++) {             System.out.print((i + 1) + ". Enter string: ");             stringList[i] = scanner.nextLine();         }          // 读取目标字符串         System.out.print("Enter target: ");         String target = scanner.nextLine();          // 计算每个字符串与目标字符串的海明距离         for (int i = 0; i < 5; i++) {             distances[i] = hamming(target, stringList[i]);         }          int minDistance = Integer.MAX_VALUE; // 初始化为最大值，用于寻找最小值         int minDistanceIndex = -1;           // 记录最短距离的字符串索引          // 查找最短海明距离         for (int i = 0; i < 5; i++) {             // 忽略-1（表示长度不匹配，无法计算海明距离）             if (distances[i] != -1) {                 if (distances[i] < minDistance) {                     minDistance = distances[i];                     minDistanceIndex = i;                 }             }         }          // 显示distances数组内容         System.out.println("Contents of array distances");         for (int i = 0; i < 5; i++) {             System.out.println(i + " " + distances[i]);         }          // 显示最短距离对应的字符串         if (minDistanceIndex != -1) {             System.out.println("String with min Hamming distance: " + stringList[minDistanceIndex] + ".");         } else {             System.out.println("No Hamming distance found");         }          scanner.close(); // 关闭Scanner资源     } }

5. 注意事项与总结

字符串长度: 海明距离的核心前提是两个字符串必须等长。本教程严格按照要求，在长度不匹配时返回 -1。
大小写敏感: charAt() 方法进行字符比较是大小写敏感的。如果需要进行不区分大小写的比较，可以先将字符串转换为全大写或全小写（例如 s1.toLowerCase().charAt(i)）。
输入验证: 本教程假设用户输入有效字符串。在实际应用中，可能需要添加更 robust 的输入验证，例如检查输入是否为空。
多个最短距离: 如果存在多个字符串与目标字符串具有相同的最短海明距离，本实现将只显示第一个找到的字符串。如果需要显示所有具有最短距离的字符串，可以在 minDistanceIndex 找到后，再遍历一次 distances 数组，收集所有匹配的索引。

通过本教程，您应该已经掌握了如何在Java中实现海明距离的计算，以及如何在一个字符串列表中查找与目标字符串海明距离最短的元素。这个基本框架可以根据具体需求进行扩展和优化。

Hello! 欢迎来到悠悠畅享网！