boxmoe_header_banner_img

Hello! 欢迎来到悠悠畅享网!

文章导读

检查排序子数组是否存在于更大的排序数组中:O(log n) 复杂度实现


avatar
站长 2025年8月7日 8

检查排序子数组是否存在于更大的排序数组中:O(log n) 复杂度实现

本文介绍了一种在 O(max(log n, k)) 时间复杂度内,判断一个大小为 k 的已排序子数组是否存在于一个大小为 n 的已排序数组中的方法。该方法基于二分查找定位子数组的起始元素,并进行后续验证,尤其适用于 n 远大于 k 的情况。

问题描述

给定两个已排序的数组 v (大小为 n) 和 v’ (大小为 k,其中 k

解决方案

该问题的核心在于利用已排序数组的特性,结合二分查找和线性验证,将时间复杂度控制在 O(max(log n, k))。

算法步骤

  1. 二分查找起始元素: 在较大的数组 v 中,使用二分查找算法查找子数组 v’ 的第一个元素。二分查找的时间复杂度为 O(log n)。

  2. 线性验证: 如果在 v 中找到了 v’ 的第一个元素,则从该位置开始,线性地比较 v 和 v’ 的剩余元素。需要注意的是,这里假设 v’ 中的元素必须在 v 中连续存在。线性验证的时间复杂度为 O(k)。

Python 代码示例

def is_subarray_present(v, v_prime):     """     检查排序子数组 v_prime 是否存在于更大的排序数组 v 中。      Args:         v: 大的排序数组。         v_prime: 需要检查的排序子数组。      Returns:         如果 v_prime 存在于 v 中,则返回 True,否则返回 False。     """     n = len(v)     k = len(v_prime)      if k > n:         return False      # 二分查找 v_prime 的第一个元素     left, right = 0, n - 1     first_element_index = -1      while left <= right:         mid = (left + right) // 2         if v[mid] == v_prime[0]:             first_element_index = mid             break  # 找到第一个元素,退出循环         elif v[mid] < v_prime[0]:             left = mid + 1         else:             right = mid - 1      # 如果没有找到 v_prime 的第一个元素,则 v_prime 不存在于 v 中     if first_element_index == -1:         return False      # 线性验证剩余元素     for i in range(1, k):         if first_element_index + i >= n or v[first_element_index + i] != v_prime[i]:             return False      return True  # 示例 v = [-10, -3, 0, 4, 7, 19, 33] v_prime = [4, 7, 19] result = is_subarray_present(v, v_prime) print(f"v_prime 是否存在于 v 中: {result}")  # 输出: v_prime 是否存在于 v 中: True  v_prime2 = [4, 7, 20] result2 = is_subarray_present(v, v_prime2) print(f"v_prime2 是否存在于 v 中: {result2}") # 输出: v_prime2 是否存在于 v 中: False  v_prime3 = [-10] result3 = is_subarray_present(v, v_prime3) print(f"v_prime3 是否存在于 v 中: {result3}") # 输出: v_prime3 是否存在于 v 中: True  v_prime4 = [33,34] result4 = is_subarray_present(v, v_prime4) print(f"v_prime4 是否存在于 v 中: {result4}") # 输出: v_prime4 是否存在于 v 中: False

时间复杂度分析

  • 二分查找:O(log n)
  • 线性验证:O(k)

总时间复杂度:O(log n + k)。由于通常情况下我们关注的是最坏情况,可以将其表示为 O(max(log n, k))。 当 n 远大于 k 时,时间复杂度接近 O(log n)。

注意事项

  • 该算法要求两个数组都已排序。
  • 线性验证部分假设子数组 v’ 在 v 中是连续的。如果允许 v’ 中的元素在 v 中不连续出现,则需要修改线性验证部分。
  • 如果 v_prime 为空数组,根据实际需求,可以返回 True 或 False。上述代码返回 True。

总结

通过结合二分查找和线性验证,我们可以在 O(max(log n, k)) 的时间复杂度内,有效地判断一个排序子数组是否存在于一个更大的排序数组中。这种方法在处理大型数据集时,可以显著提高效率。



评论(已关闭)

评论已关闭