最近讀者群里有個讀者跟我私信,說去面試微軟遇到了一系列和數(shù)學(xué)相關(guān)的算法題,直接懵圈了。我看了下題目,發(fā)現(xiàn)這些題其實(shí)就是 LeetCode 上面「丑數(shù)」系列問題的修改版。
首先,「丑數(shù)」系列問題屬于會者不難難者不會的類型,因?yàn)闀玫叫?shù)學(xué)定理嘛,如果沒有專門學(xué)過,靠自己恐怕是想不出來的。
另外,這類問題而且非??疾斐橄舐?lián)想能力,因?yàn)樗藬?shù)學(xué)定理之外,還需要你把題目抽象成鏈表相關(guān)的題目運(yùn)用雙指針技巧,或者抽象成數(shù)組相關(guān)的題目運(yùn)用二分搜索技巧。
那么今天我就來用一篇文章把所有丑數(shù)相關(guān)的問題一網(wǎng)打盡,看看這類問題能夠如何變化,應(yīng)該如何解決。
丑數(shù) I
首先是力扣第 263 題「丑數(shù)」,題目給你輸入一個數(shù)字n
,請你判斷n
是否為「丑數(shù)」。所謂「丑數(shù)」,就是只包含質(zhì)因數(shù)2
、3
和5
的正整數(shù)。
函數(shù)簽名如下:
booleanisUgly(intn)
比如 12 = 2 x 2 x 3 就是一個丑數(shù),而 42 = 2 x 3 x 7 就不是一個丑數(shù)。
這道題其實(shí)非常簡單,前提是你知道算術(shù)基本定理(正整數(shù)唯一分解定理):
任意一個大于 1 的自然數(shù),要么它本身就是質(zhì)數(shù),要么它可以分解為若干質(zhì)數(shù)的乘積。
既然任意一個大于一的正整數(shù)都可以分解成若干質(zhì)數(shù)的乘積,那么丑數(shù)也可以被分解成若干質(zhì)數(shù)的乘積,且這些質(zhì)數(shù)只能是 2, 3 或 5。
有了這個思路,就可以實(shí)現(xiàn)isUgly
函數(shù)了:
publicbooleanisUgly(intn){
if(n<=?0)returnfalse;
//如果n是丑數(shù),分解因子應(yīng)該只有2,3,5
while(n%2==0)n/=2;
while(n%3==0)n/=3;
while(n%5==0)n/=5;
//如果能夠成功分解,說明是丑數(shù)
returnn==1;
}
丑數(shù) II
接下來提升難度,看下力扣第 264 題「丑數(shù) II」,現(xiàn)在題目不是讓你判斷一個數(shù)是不是丑數(shù),而是給你輸入一個n
,讓你計算第n
個丑數(shù)是多少,函數(shù)簽名如下:
intnthUglyNumber(intn)
比如輸入n = 10
,函數(shù)應(yīng)該返回 12,因?yàn)閺男〉酱蟮某髷?shù)序列為1, 2, 3, 4, 5, 6, 8, 9, 10, 12
,第 10 個丑數(shù)是 12(注意我們把 1 也算作一個丑數(shù))。
這道題很精妙,你看著它好像是道數(shù)學(xué)題,實(shí)際上它卻是一個合并多個有序鏈表的問題,同時用到了篩選素數(shù)的思路。
首先,我在前文如何高效尋找質(zhì)數(shù)中也講過高效篩選質(zhì)數(shù)的「篩數(shù)法」:一個質(zhì)數(shù)和除 1 以外的其他數(shù)字的乘積一定不是質(zhì)數(shù),把這些數(shù)字篩掉,剩下的就是質(zhì)數(shù)。
Wikipedia 的這幅圖很形象:
基于篩數(shù)法的思路和丑數(shù)的定義,我們不難想到這樣一個規(guī)律:如果一個數(shù)x
是丑數(shù),那么x * 2, x * 3, x * 5
都一定是丑數(shù)。
如果我們把所有丑數(shù)想象成一個從小到大排序的鏈表,就是這個樣子:
1->2->3->4->5->6->8->...
然后,我們可以把丑數(shù)分為三類:2 的倍數(shù)、3 的倍數(shù)、5 的倍數(shù)。這三類丑數(shù)就好像三條有序鏈表,如下:
能被 2 整除的丑數(shù):
1*2->2*2->3*2->4*2->5*2->6*2->8*2->...
能被 3 整除的丑數(shù):
1*3->2*3->3*3->4*3->5*3->6*3->8*3->...
能被 5 整除的丑數(shù):
1*5->2*5->3*5->4*5->5*5->6*5->8*5->...
我們?nèi)绻堰@三條「有序鏈表」合并在一起并去重,得到的就是丑數(shù)的序列,其中第n
個元素就是題目想要的答案:
1->1*2->1*3->2*2->1*5->3*2->4*2->...
所以這里就和鏈表雙指針技巧匯總中講到的合并兩條有序鏈表的思路基本一樣了,先看下合并有序鏈表的核心解法代碼:
ListNodemergeTwoLists(ListNodel1,ListNodel2){
//虛擬頭結(jié)點(diǎn)存儲結(jié)果鏈表,p指針指向結(jié)果鏈表
ListNodedummy=newListNode(-1),p=dummy;
//p1,p2分別在兩條有序鏈表上
ListNodep1=l1,p2=l2;
while(p1!=null&&p2!=null){
//比較p1和p2兩個指針
//將值較小的的節(jié)點(diǎn)接到結(jié)果鏈表
if(p1.val>p2.val){
p.next=p2;
p2=p2.next;
}else{
p.next=p1;
p1=p1.next;
}
//p指針不斷前進(jìn)
p=p.next;
}
//省略部分非核心代碼...
}
對于這道題,我們抽象出三條有序的丑數(shù)鏈表,合并這三條有序鏈表得到的結(jié)果就是丑數(shù)序列,其中第n
個丑數(shù)就是題目想要的答案。
類比合并兩個有序鏈表,看下這道題的解法代碼:
intnthUglyNumber(intn){
//可以理解為三個指向有序鏈表頭結(jié)點(diǎn)的指針
intp2=1,p3=1,p5=1;
//可以理解為三個有序鏈表的頭節(jié)點(diǎn)的值
intproduct2=1,product3=1,product5=1;
//可以理解為最終合并的有序鏈表(結(jié)果鏈表)
int[]ugly=newint[n+1];
//可以理解為結(jié)果鏈表上的指針
intp=1;
//開始合并三個有序鏈表,找到第n個丑數(shù)時結(jié)束
while(p<=?n)?{
????????//取三個鏈表的最小結(jié)點(diǎn)
intmin=Math.min(Math.min(product2,product3),product5);
//將最小節(jié)點(diǎn)接到結(jié)果鏈表上
ugly[p]=min;
p++;
//前進(jìn)對應(yīng)有序鏈表上的指針
if(min==product2){
product2=2*ugly[p2];
p2++;
}
if(min==product3){
product3=3*ugly[p3];
p3++;
}
if(min==product5){
product5=5*ugly[p5];
p5++;
}
}
//返回第n個丑數(shù)
returnugly[n];
}
我們用p2, p3, p5
分別代表三條丑數(shù)鏈表上的指針,用product2, product3, product5
代表丑數(shù)鏈表上節(jié)點(diǎn)的值,用ugly
數(shù)組記錄有序鏈表合并之后的結(jié)果。
有了之前的鋪墊和類比,你應(yīng)該很容易看懂這道題的思路了,接下來我們再提高一點(diǎn)難度。
超級丑數(shù)
看下力扣第 313 題「超級丑數(shù)」,這道題給你輸入一個質(zhì)數(shù)列表primes
和一個正整數(shù)n
,請你計算第n
個「超級丑數(shù)」。所謂超級丑數(shù)是一個所有質(zhì)因數(shù)都出現(xiàn)在primes
中的正整數(shù),函數(shù)簽名如下:
int nthSuperUglyNumber(intn,int[]primes)
如果讓primes = [2, 3, 5]
就是上道題,所以這道題是上道題的進(jìn)階版。
不過思路還是類似的,你還是把每個質(zhì)因子看做一條有序鏈表,上道題相當(dāng)于讓你合并三條有序鏈表,而這道題相當(dāng)于讓你合并len(primes)
條有序鏈表,也就是雙指針技巧秒殺七道鏈表題目中講過的「合并 K 條有序鏈表」的思路。
注意我們在上道題抽象出了三條鏈表,需要p2, p3, p5
作為三條有序鏈表上的指針,同時需要product2, product3, product5
記錄指針?biāo)腹?jié)點(diǎn)的值,每次循環(huán)用min
函數(shù)計算最小頭結(jié)點(diǎn)。
這道題相當(dāng)于輸入了len(primes)
條有序鏈表,我們不能用min
函數(shù)計算最小頭結(jié)點(diǎn)了,而是要用優(yōu)先級隊列來計算最小頭結(jié)點(diǎn),同時依然要維護(hù)鏈表指針、指針?biāo)腹?jié)點(diǎn)的值,我們可以用一個三元組來保存這些信息。
你結(jié)合雙指針技巧秒殺七道鏈表題目合并 K 條有序鏈表的思路就能理解這道題的解法:
intnthSuperUglyNumber(intn,int[]primes){
//優(yōu)先隊列中裝三元組int[]{product,prime,pi}
//其中product代表鏈表節(jié)點(diǎn)的值,prime是計算下一個節(jié)點(diǎn)所需的質(zhì)數(shù)因子,pi代表鏈表上的指針
PriorityQueue<int[]>pq=newPriorityQueue<>((a,b)->{
//優(yōu)先級隊列按照節(jié)點(diǎn)的值排序
returna[0]-b[0];
});
//把多條鏈表的頭結(jié)點(diǎn)加入優(yōu)先級隊列
for(inti=0;inewint[]{1,primes[i],1});
}
//可以理解為最終合并的有序鏈表(結(jié)果鏈表)
int[]ugly=newint[n+1];
//可以理解為結(jié)果鏈表上的指針
intp=1;
while(p<=?n)?{
????????//取三個鏈表的最小結(jié)點(diǎn)
int[]pair=pq.poll();
intproduct=pair[0];
intprime=pair[1];
intindex=pair[2];
//避免結(jié)果鏈表出現(xiàn)重復(fù)元素
if(product!=ugly[p-1]){
//接到結(jié)果鏈表上
ugly[p]=product;
p++;
}
//生成下一個節(jié)點(diǎn)加入優(yōu)先級隊列
int[]nextPair=newint[]{ugly[index]*prime,prime,index+1};
pq.offer(nextPair);
}
returnugly[n];
}
接下來看下第四道丑數(shù)題目,也是今天的壓軸題。
丑數(shù) III
這是力扣第 1201 題「丑數(shù) III」,看下題目:
給你四個整數(shù):n, a, b, c
,請你設(shè)計一個算法來找出第n
個丑數(shù)。其中丑數(shù)是可以被a
或b
或c
整除的正整數(shù)。
這道題和之前題目的不同之處在于它改變了「丑數(shù)」的定義,只要一個正整數(shù)x
存在a, b, c
中的任何一個因子,那么x
就是丑數(shù)。
比如輸入n = 7, a = 3, b = 4, c = 5
,那么算法輸出 10,因?yàn)榉蠗l件的丑數(shù)序列為3, 4, 5, 6, 8, 9, 10, ...
,其中第 7 個數(shù)字是 10。
有了之前幾道題的鋪墊,你肯定可以想到把a, b, c
的倍數(shù)抽象成三條有序鏈表:
1*3->2*3->3*3->4*3->5*3->6*3->7*3->...
1*4->2*4->3*4->4*4->5*4->6*4->7*4->...
1*5->2*5->3*5->4*5->5*5->6*5->7*5->...
然后將這三條鏈表合并成一條有序鏈表并去除重復(fù)元素,這樣合并后的鏈表元素就是丑數(shù)序列,我們從中找到第n
個元素即可:
1*3->1*4->1*5->2*3->2*4->3*3->2*5->...
有了這個思路,可以直接寫出代碼:
publicintnthUglyNumber(intn,inta,intb,intc){
//可以理解為三個有序鏈表的頭結(jié)點(diǎn)的值
//由于數(shù)據(jù)規(guī)模較大,用long類型
longproductA=a,productB=b,productC=c;
//可以理解為合并之后的有序鏈表上的指針
intp=1;
longmin=-666;
//開始合并三個有序鏈表,獲取第n個節(jié)點(diǎn)的值
while(p<=?n)?{
????????//取三個鏈表的最小結(jié)點(diǎn)
min=Math.min(Math.min(productA,productB),productC);
p++;
//前進(jìn)最小結(jié)點(diǎn)對應(yīng)鏈表的指針
if(min==productA){
productA+=a;
}
if(min==productB){
productB+=b;
}
if(min==productC){
productC+=c;
}
}
return(int)min;
}
這個思路應(yīng)該是非常簡單的,但是提交之后并不能通過所有測試用例,會超時。
注意題目給的數(shù)據(jù)范圍非常大,a, b, c, n
的大小可以達(dá)到 10^9,所以即便上述算法的時間復(fù)雜度是O(n)
,也是相對比較耗時的,應(yīng)該有更好的思路能夠進(jìn)一步降低時間復(fù)雜度。
這道題的正確解法難度比較大,難點(diǎn)在于你要把一些數(shù)學(xué)知識和二分搜索技巧結(jié)合起來才能高效解決這個問題。
首先,我們可以定義一個單調(diào)遞增的函數(shù)f
:
f(num, a, b, c)
計算[1..num]
中,能夠整除a
或b
或c
的數(shù)字的個數(shù),顯然函數(shù)f
的返回值是隨著num
的增加而增加的(單調(diào)遞增)。
題目讓我們求第n
個能夠整除a
或b
或c
的數(shù)字是什么,也就是說我們要找到一個最小的num
,使得f(num, a, b, c) == n
。
這個num
就是第n
個能夠整除a
或b
或c
的數(shù)字。
根據(jù)二分查找的實(shí)際運(yùn)用給出的思路模板,我們得到一個單調(diào)函數(shù)f
,想求參數(shù)num
的最小值,就可以運(yùn)用搜索左側(cè)邊界的二分查找算法了:
intnthUglyNumber(intn,inta,intb,intc){
//題目說本題結(jié)果在[1,2*10^9]范圍內(nèi),
//所以就按照這個范圍初始化兩端都閉的搜索區(qū)間
intleft=1,right=(int)2e9;
//搜索左側(cè)邊界的二分搜索
while(left<=?right)?{
????????intmid=left+(right-left)/2;
if(f(mid,a,b,c)//[1..mid]中符合條件的元素個數(shù)不足n,所以目標(biāo)在右半邊
left=mid+1;
}else{
//[1..mid]中符合條件的元素個數(shù)大于n,所以目標(biāo)在左半邊
right=mid-1;
}
}
returnleft;
}
//函數(shù)f是一個單調(diào)函數(shù)
//計算[1..num]之間有多少個能夠被a或b或c整除的數(shù)字
longf(intnum,inta,intb,intc){
//下文實(shí)現(xiàn)
}
搜索左側(cè)邊界的二分搜索代碼模板在二分查找框架詳解中講過,沒啥可說的,關(guān)鍵說一下函數(shù)f
怎么實(shí)現(xiàn),這里面涉及容斥原理以及最小公因數(shù)、最小公倍數(shù)的計算方法。
首先,我把[1..num]
中能夠整除a
的數(shù)字歸為集合A
,能夠整除b
的數(shù)字歸為集合B
,能夠整除c
的數(shù)字歸為集合C
,那么len(A) = num / a, len(B) = num / b, len(C) = num / c
,這個很好理解。
但是f(num, a, b, c)
的值肯定不是num / a + num / b + num / c
這么簡單,因?yàn)槟阕⒁庥行?shù)字可能可以被a, b, c
中的兩個數(shù)或三個數(shù)同時整除,如下圖:
按照容斥原理,這個集合中的元素應(yīng)該是:A + B + C - A ∩ B - A ∩ C - B ∩ C + A ∩ B ∩ C。結(jié)合上圖應(yīng)該很好理解。
問題來了,A, B, C
三個集合的元素個數(shù)我們已經(jīng)算出來了,但如何計算像A ∩ B
這種交集的元素個數(shù)呢?
其實(shí)也很容易想明白,A ∩ B
的元素個數(shù)就是num / lcm(a, b)
,其中lcm
是計算最小公倍數(shù)(Least Common Multiple)的函數(shù)。
類似的,A ∩ B ∩ C
的元素個數(shù)就是num / lcm(lcm(a, b), c)
的值。
現(xiàn)在的問題是,最小公倍數(shù)怎么求?
直接記住定理吧:lcm(a, b) = a * b / gcd(a, b)
,其中gcd
是計算最大公因數(shù)(Greatest Common Divisor)的函數(shù)。
現(xiàn)在的問題是,最大公因數(shù)怎么求?這應(yīng)該是經(jīng)典算法了,我們一般叫輾轉(zhuǎn)相除算法(或者歐幾里得算法)。
好了,套娃終于套完了,我們可以把上述思路翻譯成代碼就可以實(shí)現(xiàn)f
函數(shù),注意本題數(shù)據(jù)規(guī)模比較大,有時候需要用long
類型防止int
溢出:
//計算最大公因數(shù)(輾轉(zhuǎn)相除/歐幾里得算法)
longgcd(longa,longb){
if(a//保證a>b
returngcd(b,a);
}
if(b==0){
returna;
}
returngcd(b,a%b);
}
//最小公倍數(shù)
longlcm(longa,longb){
//最小公倍數(shù)就是乘積除以最大公因數(shù)
returna*b/gcd(a,b);
}
//計算[1..num]之間有多少個能夠被a或b或c整除的數(shù)字
longf(intnum,inta,intb,intc){
longsetA=num/a,setB=num/b,setC=num/c;
longsetAB=num/lcm(a,b);
longsetAC=num/lcm(a,c);
longsetBC=num/lcm(b,c);
longsetABC=num/lcm(lcm(a,b),c);
//集合論定理:A + B + C - A ∩ B - A ∩ C - B ∩ C + A ∩ B ∩ C
returnsetA+setB+setC-setAB-setAC-setBC+setABC;
}
實(shí)現(xiàn)了f
函數(shù),結(jié)合之前的二分搜索模板,時間復(fù)雜度下降到對數(shù)級別,即可高效解決這道題目了。
以上就是所有「丑數(shù)」相關(guān)的題目,用到的知識點(diǎn)有算術(shù)基本定理、容斥原理、輾轉(zhuǎn)相除法、鏈表雙指針合并有序鏈表、二分搜索模板等等。
如果沒做過類似的題目可能很難想出來,但只要做過,也就手到擒來了。所以我說這種數(shù)學(xué)問題屬于會者不難,難者不會的類型。
審核編輯:湯梓紅
-
算法
+關(guān)注
關(guān)注
23文章
4613瀏覽量
92957 -
函數(shù)
+關(guān)注
關(guān)注
3文章
4332瀏覽量
62666
原文標(biāo)題:微軟面試題解析:丑數(shù)系列算法
文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論