在计算机科学中,二分搜索(binary search),也称折半搜索(half-interval search)、对数搜索(logarithmic search),是一种在有序数组中查找某一特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。如果在某一步骤数组为空,则代表找不到。这种搜索算法每一次比较都使搜索范围缩小一半。
给定一个有序的数组,查找value是否在数组中,不存在返回-1。
例如:{ 1, 2, 3, 4, 5 }找3,返回下标2(下标从0开始计算)。
/* 注意:题目保证数组不为空,且 n 大于等于 1 ,以下问题默认相同 */
int BinarySearch(int array[], int n, int value)
{
int left = 0;
int right = n - 1;
// 如果这里是 int right = n 的话,那么下面有两处地方需要修改,以保证一一对应:
// 1、下面循环的条件则是 while(left < right)
// 2、循环内当 array[middle] > value 的时候,right = middle
while (left <= right) // 循环条件,适时而变
{
int middle = left + ((right - left) >> 1); // 防止溢出,移位也更高效。同时,每次循环都需要更新。
if (array[middle] > value)
right = middle - 1; // right 赋值,适时而变
else if (array[middle] < value)
left = middle + 1;
else
return middle;
// 可能会有读者认为刚开始时就要判断相等,但毕竟数组中不相等的情况更多
// 如果每次循环都判断一下是否相等,将耗费时间
}
return -1;
}
给定一个有序的数组,查找第一个等于value的下标,找不到返回-1。
例如:{ 1, 2, 2, 2, 4 }找2,返回下标1(下标从0开始计算)。
int BinarySearch(int array[], int n, int value)
{
int left = 0;
int right = n - 1;
while (left <= right)
{
int middle = left + ((right - left) >> 1);
if (array[middle] >= value) // 因为是找到最小的等值下标,所以等号放在这里
right = middle - 1;
else
left = middle + 1;
}
if (left < n && array[left] == value)
return left;
return -1;
}
如果问题改为"查找value最后一个等于value的下标"呢?只需改动两个位置:
-
if (array[middle] >= value)
中的等号去掉; -
if (left < n && array[left] == value) return left;
改为
if (right >= 0 && array[right] == value) return right;
给定一个有序的数组,查找第一个大于等于value的下标,都比value小则返回-1。
也就是说如果有等于value的返回第一个等于value的下标,如果没有则返回第一个大于value的下标。
int BinarySearch(int array[], int n, int value)
{
int left = 0;
int right = n - 1;
while (left <= right)
{
int middle = left + ((right - left) >> 1);
if (array[middle] >= value)
right = middle - 1;
else
left = middle + 1;
}
return (left < n) ? left : -1;
}
如果问题改为"查找最后一个小于等于value的下标"呢?只需改动两个位置:
if (array[middle] >= value)
的等号去掉;return (left < n) ? left : -1
改为return (right >= 0) ? right : -1
。
给定一个轮转后的有序数组(所谓转轮有序数组,比如:{ 2, 3, 4, 5, 1 },{ 5, 1, 2, 3, 4 }),查找value是否在数组中,不存在返回-1。
int BinarySearch(int array[], int n, int value)
{
int left = 0;
int right = n - 1;
while (left <= right)
{
int middle = left + ((right - left) >> 1);
if (value < array[middle])
{
if (array[middle] < array[right])
right = middle - 1;
else
{
if (value < array[left])
left = middle + 1;
else
right = middle - 1;
}
}
else if (value > array[middle])
{
if (array[middle] > array[left])
left = middle + 1;
else
{
if (value > array[right])
right = middle - 1;
else
left = middle + 1;
}
}
else
return middle;
}
return -1;
}
理解上面的代码很简单,只需从三个方面考虑: { 1, 2, 3, 4, 5 }, { 2, 3, 4, 5, 1 }, { 5, 1, 2, 3, 4 }。
二分算法所操作的区间,是左闭右开,还是左闭右闭,需要在循环体跳出判断中,以及每次修改left,,right区间值这两个地方保持一致,否则就可能出错。
另外,我发现一个小技巧(个人观点,正确性未经考证,仅作参考):
当我们写好一个二分程序的时候,总希望找到一些数据来考证我们的程序的正确性,但差强人意的是,我们总会遗漏某个测试数据,从而导致程序依旧存在bug。而我想说的是,我的这个小技巧可以把针对二分的成千上万所有的测试数据都压缩成与之等价的屈指可数的几个测试数据。
我们知道二分的思想就是每次取一半,想象一下,不管给我们的数组有多长,每次取一半,最终都会被压缩成长度为1的数组,然后在这个长度为1的数组里判断并返回,所以我们可以直接用长度为1的数组来测试程序。以上述的"问题3:给定一个有序的数组,查找第一个大于等于value的下标,都比value小则返回-1"为例。
-
若找不到。例如数组为{ 0 },value = 1,则left = 1,right = 0,left越界;
-
若可以找到;
- 找到等于value的。例如数组为{ 0 },value = 0,则left = 0,right = -1,right越界;
- 找到大于value的。例如数组为{ 0 },value = -1,则left = 0,right = -1,right越界;
对比程序最后的返回语句return (left < n) ? left : -1
,代码正确。