Lei Xia

Sr. Software Engineer | Solution Architect

抒写代码,尽享生活,筑就未来。

订阅 · 赞赏

avatar

水塘抽样算法

2023年1月19日 · 100 字 · 1 分钟

下面是维基百科水塘抽样的说明。 水塘抽样是一系列的随机算法,其目的在于从包含 $n$个项目的集合 中选取$k$ 个样本,其中 $n$为一很大或未知的数量,尤其适用于不能把所有 $n$ 个项目都存放到内存的情况。

时间差计算算法

2023年1月19日 · 103 字 · 1 分钟

本文分享如何解决计算时间差类的问题。 算法 首先需要将时间转化为数字,比如23:59,可以转化为23*60+59 然后根据数字从小到大排序,此时从[0, n]处的数据有序,可以遍历该区间计算差值 需要注意的是,由于时间的特殊性,比如23:59下一分会归0,因此还需要比如0处和n处的时间差 示例 Leetcode 539.

滑动窗口算法

2023年1月19日 · 128 字 · 1 分钟

滑动窗口算法是查找连续区间常用的算法之一。 本文分享滑动窗口算法的通用框架。 算法 定义$left$和$right$双指针,代表窗口的左边界和右边界 当$right$小于给定区间大小时,我们可以进行操作。 在扩大窗口时,需要加当前新加入的数据进行处理 当当前窗口内数据不满足条件时,右移$left$指针缩小窗口 计算$[left,right]$之间的数据,和最佳答案比较并更新最佳答案 右移$right$ 下面是滑动窗口通用框架的java语言实现。

字符串子序列检测算法

2023年1月5日 · 63 字 · 1 分钟

本文分享一种检测一个字符串是否为另一个字符串子序列的算法。 子序列的定义: 若字符串$s1$可以由字符串$s2$删除某些字符得到,则$s1$是$s2$的子序列。换句话说,若$s1$的所有字符都在$s2$中且顺序一致,则$s1$是$s2$的子序列。 例如: a是aaa的子序列,adf是abcdef的子序列,但是cba不是abc的子序列(因为字符顺序变了)。

计算数字二进制位中1的个数

2023年1月5日 · 48 字 · 1 分钟

本文分享一种计算给定数字二进制表示中有多少个1的算法。 位运算对于非硬件相关的开发者来说可能用的比较少,朴素做法是将数字转换为二进制字符串,然后遍历该字符串得到1的个数。 算法 通过右移我们可以访问到数字的指定比特 将该比特与1进行按位与&,结果为1则证明当前比特位是1,计数器+1 根据给定数字的数据类型可以确定需要位移的次数,对于int来说,4个字节,因此需要右移32次,而对于long来说,8个字节,需要右移64次。

解析字符串中的数字

2023年1月3日 · 108 字 · 1 分钟

本文分享一种如何在字符串中解析数字的算法。 思路 解析字符串中的数字需要判断当前是否是数字字符,以及如何处理连续的数字字符。 本文使用while循环来解析数字,之所以不使用for循环,是笔者认为while循环操控力比for循环要好。 while循环解析方法如下:

查找第N大的数

2023年1月3日 · 206 字 · 1 分钟

在给定的序列中查找第N大的数,朴素做法是对序列排序,然后根据索引直接查询,时间复杂度为$O(nlogn)$。 本文介绍一种在$O(n)$的时间复杂度查询第N大的数的算法。 算法 算法思路就是定义标志变量,然后遍历数组,根据标志变量和当前数组变量的大小更新标志变量,最后根据情况返回标志变量。 示例:查找第2大的数 定义$first$和$second$分别存储最大和次大,然后遍历数组时更新即可。

洗牌算法

2023年1月3日 · 99 字 · 1 分钟

洗牌算法用来将给定的序列打乱,可以认为是排序的反操作。 正确性判断 对于包含$n$个元素的序列,其全排列有$n!$种。如果序列打乱的结果为$n!$种且每种序列出现的概率相同,则是正确的洗牌算法。 Fisher–Yates 洗牌算法 以下算法说明摘自: https://gaohaoyang.

原地哈希算法

2022年12月31日 · 214 字 · 2 分钟

原地哈希算法(Cyclic Sort)主要应用在值都在$[0,n]$的数组$nums$中,此时可以将$nums[i]$作为索引,放回原数组,当然,由于程序上索引是从0开始,因此可以将$nums[i]$放到$nums[nums[i]-1]$的位置上。 举例 Leetcode 268. 丢失的数字

厄拉多塞筛素数筛选算法

2022年12月31日 · 197 字 · 1 分钟

厄拉多塞筛算法(Eratosthenes Sieve)是一种求素数的方法,由古希腊数学家厄拉多塞提出。它的原理是,给定一个数 n,从 2 开始依次将 $\sqrt n$ 以内的素数的倍数标记为合数,标记完成后,剩余未被标记的数为素数(从 2 开始)。如此可省去检查每个数的步骤,使筛选素数的过程更加简单。