B GIÁO DC VÀ ĐÀO TO
TRƯNG ĐI HC BÁCH KHOA HÀ NI
---------------------------------------
Vũ Văn Tú
PHƯƠNG PHÁP SUY DIN NHANH CHO BÀI TOÁN
CC ĐI HOÁ PHÂN PHI HU NGHIM
NGƯI HƯNG DN:
TS. Thân Quang Khoát
Hà Ni 10/2018
2
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
CNG HÒA XÃ HI CH NGHĨA VIT NAM
Độc lp – T do – Hnh phúc
BN XÁC NHN CHNH SA LUN VĂN THC SĨ
H và tên tác gi lun văn : Vũ Văn Tú
Đề tài lun văn: Phương pháp suy din nhanh cho bài toán cc đi hoá phân phi
hu nghim
Chuyên ngành: Công ngh thông tin Thc sĩ kĩ thut
Mã s SV: CB160544
Tác gi, Ngưi hưng dn khoa hc Hi đng chm lun văn xác nhn
tác gi đã sa cha, b sung lun văn theo biên bn hp Hi đng ngày 27/10/2018 vi
các ni dung sau:
- Chnh sa li chương mc đi vi lun văn.
- Rút gn s lưng chương mc ca lun văn.
Ngày 30 tháng 10 năm 2018
Giáo viên hướng dn Tác gi lun văn
CH TCH HI ĐNG
3
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Mc lc Trang
Li cam đoan .................................................................................................................................. 4
Danh sách các t viết tt và thut ng ............................................................................................ 6
Danh sách các kí hiu dùng trong lun văn .................................................................................... 6
Danh sách hình v ........................................................................................................................... 7
Danh sách bng ............................................................................................................................... 7
M ĐẦU ........................................................................................................................................ 8
Chương 1 - TNG QUAN .............................................................................................................. 9
Chương 2 - CƠ S LÝ THUYT LIÊN QUAN .......................................................................... 11
2.1 Các kiến thc v xác sut thng kê ............................................................................................11
2.1.1 Phân phi Multinomial ......................................................................................................11
2.1.2 Phân phi Dirichlet ............................................................................................................12
2.2 Mô hình đ th xác sut ..............................................................................................................12
2.3 Các thut toán ti ưu cơ bn trong hc máy ...............................................................................15
2.3.1 Gradient Descent ...............................................................................................................17
2.3.2 Expectation-Maximization ................................................................................................18
2.3.3 Conditional Gradient Descent (Frank Wolfe) ....................................................................20
Chương 3 - MÔ HÌNH CH ĐỀ VÀ BÀI TOÁN CC ĐẠI HOÁ PHÂN PHI HU NGHIM
TRONG MÔ HÌNH CH ĐỀ ....................................................................................................... 23
3.1 Mô hình ch đề Latent Diriclet Allocation [1] ...........................................................................23
3.2 Bài toán suy din trong mô hình ch đề .....................................................................................28
3.3 Thut toán Online Maximum a Posteriori Estimation (OPE) ....................................................30
Chương 4 – THUT TOÁN CI TIN GENERALIZED ONLINE MAXIMUM A
POSTERIORI ESTIMATION (G-OPE) ....................................................................................... 34
Chương 5 – KT QU THC NGHIM .................................................................................... 37
5.1 Thut toán Online-OPE ..............................................................................................................37
5.2 Các đ đo th nghim .................................................................................................................38
5.2.1 Độ đo xác sut d đoán (Log Predictive Probability) .......................................................38
5.2.2 Độ đo cht lưng ch đề (Normalized Pointwise Mutual Information) ............................39
5.3 D liu và các tham s khi th nghim ......................................................................................40
5.4 G-OPE vi các tham s ! khác nhau ..........................................................................................41
5.5 So sánh Online-GOPE vi các thut toán hc khác cho LDA ...................................................43
KT LUN ................................................................................................................................... 46
TÀI LIU THAM KHO ............................................................................................................ 47
4
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Li cam đoan
Tôi Vũ Văn Tú cam kết lun văn này là công trình nghiên cu ca bn thân tôi
dưi s hưng dn ca TS. Thân Quang Khoát.
Các kết qu nghiên cu trong lun văn là trung thc, không phi sao chép ca bt
c công trình đã đưc công b nào khác. Tt c các trích dn đu đưc tham chiếu rõ
ràng.
Hà Ni, ngày 7 tháng 9 năm 2018
Tác gi lun văn
Vũ Văn Tú
Xác nhn ca ngưi hưng dn
5
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
LI CM ƠN
Đầu tiên, em xin đưc gi li cm ơn chân thành đến các thy, giáo thuc trưng
đại hc Bách Khoa Ni, đc bit các thy trong vin Công ngh thông tin truyn
thông. Các thy đã trang b cho em nhng kiến thc quý báu trong thi gian em hc tp
ti trưng. Đng thi, em cũng xin gi li cm ơn đến các thy cô trong Data Science Lab,
đặc bit TS Thân Quang Khoát, NCS Bùi Th Thanh Xuân, đã tn tình hưng dn giúp
đỡ em hoàn thành lun văn này.
6
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Danh sách các t viết tt và thut ng
LDA
Latent Dirichlet Allocation
Dir
Phân phi Dirichlet
VB
Variational Bayesian
CVB
Collapsed Variational Bayesian
CGS
Collapsed Gibbs Sampling
MAP
Maxium A Posteriori
LPP
Log Predictive Probability
NPMI
Normalized Poitwise Mutual Information
Danh sách các kí hiu dùng trong lun văn
"
Hàm Digamma
#
Hàm Gamma
$
Kí hiu “đưc cho là”
%
Tc đ hc hai tham s &' (
)
Vector t l các ch đề ca mt văn bn
*
Ma trn +,-, mi hàng ca ma trn là phân phi ch đề theo các t
+
S lưng ch đề
.
/
T th 0 trong văn bn
1
/
Ch đề ca t th 0 trong văn bn
2
Tham s ca phân phi tiên nghim cho *
3
Tham s ca phân phi tiên nghim cho )
4
Tham s ca phân phi biến phân ng vi )
5
Tham s ca phân phi biến phân ng vi 6
7
Tham s ca phân phi biến phân ng vi *
V
Tp hp t đin, bao gm các t 89 : 9;' <' = = -
>' ?
Văn bn (bao gm các t)
9999@
A
S lưng t th 8 trong văn bn >
7
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Danh sách hình v Trang
Hình 1: Ví d v đồ th xác sut ....................................................................................... 13!
Hình 2:Ví d v mt đ th xác sut có hưng ................................................................. 14!
Hình 3:Cách biu din thu gn trong mô hình đ th xác sut ......................................... 15!
Hình 4:Minh ho thut toán Gradient Descent ................................................................. 18!
Hình 5:Minh ho thut toán Expectation-Maximization .................................................. 20!
Hình 6:Minh ha thut toán Frank-Wolfe ........................................................................ 21!
Hình 7:Kết qu 10 ch đề hc đưc t mô hình LDA ...................................................... 24!
Hình 8:T l ch đề ca mt văn bn mu trong mô hình LDA ....................................... 25!
Hình 9:Biu din mô hình sinh LDA ................................................................................ 27!
Hình 10:Minh ha hot đng ca thut toán OPE bng cách xây dng dãy hàm xp x
ngu nhiên B
C
D ' B
E
D ' B
F
GDH … tiến dn v IGDH ................................................ 32!
Hình 11:G-OPE trên b NYT vi các tham s p khác nhau ............................................. 42!
Hình 12:G-OPE trên b Pubmed vi các tham s p khác nhau ........................................ 43!
Hình 13:So sánh các thut toán suy din trên b NYT ..................................................... 44!
Hình 14:So sánh các thut toán suy din trên b Pubmed ................................................ 45!
Danh sách bng Trang
Bng 1: Thng kê v tp d liu s dng trong thí nghim ............................................. 40!
Bng 2: Giá tr p tt nht cho tng đ đo trên tng b d liu ........................................ 42!
8
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
M ĐẦU
Ti ưu là mt trong nhng nn tng cơ bn và quan trng trong lĩnh vc hc máy. Bài
toán ct lõi trong mi mô hình hc máy đu đưa ra mt hàm mc tiêu đ ti ưu. Vi các
bài toán ti ưu li, ta đã có nhiu công c mnh đ gii quyết hiu qu. Tuy nhiên, các bài
toán ti ưu trong hc máy ch yếu là các bài toán ti ưu không li, do đó không tn ti mt
thut toán hiu qu để áp dng cho hu hết mi bài toán. Thông thưng, ngưi ta s dng
các thut toán xp x ngu nhiên đ tìm cc tr đị a phương cho các bài toán này. Trong lun
văn này, em trình bày mt phương pháp ngu nhiên đ gii quyết bài toán cc đi hóa phân
phi hu nghim Maximum a Posteriori (MAP). Bài toán cc đi hóa phân phi hu nghim
bài toán thưng gp trong hc máy, dùng đ ước lưng tham s cho hình. Bài toán
MAP trong các mô hình hc máy thưng bài toán ti ư u không li. Lun văn đề xut
phương pháp Generalized Online Maximum a Posteriori Estimation (G-OPE) [21], là mt
phương pháp ci tiến tng quát hóa ca thut toán Online Maximum a Posterior
Estimation (OPE). OPE [6] đã đưc áp dng hiu qu trong hình ch đề Latent Dirichlet
Allocation (LDA) [1] c v mt thuyết ln kết qu thc tế. G-OPE tng quát hơn OPE,
đồng thi kết qu thc nghim đã chng minh G-OPE cho kết qu tt hơn OPE các
phương pháp suy din khác ca trong mô hình LDA. Ngoài ra, ý tưng thiết kế thut toán
ngu nghiên G-OPE có kh năng m rng áp dng trong các bài toán MAP khác ngoài các
mô hình ch đề.
9
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Chương 1 - TNG QUAN
Ngày nay, hc máy lĩnh vc đang đưc nghiên cu phát trin rt mnh m trong
ngành khoa hc máy tính. Các thut toán trong hc máy nn tng cơ bn cho các bài
toán x lí, phân tích d liu ln. Các mô hình hc máy thưng đ xut mt hàm mc tiêu
da trên các gi thiết s dng các công c trong xác sut thng kê, sau đó s dng các công
c trong ti ưu đ tìm cc tr cho hàm mc tiêu này. Vi rt nhiu bài toán, hàm mc tiêu
là các hàm không li, ví d bài toán K-Means [16], các hàm mc tiêu ca mô hình ch đề
[1, 20] … Các thut toán thưng s dng da trên Gradient Descent (GD) hay Coordinate
Descent. Các thut toán này là các phương pháp lp, nếu không có tính ngu nhiên thì kết
qu các đim cc tr địa phương cht lưng thut toán ph thuc rt ln vào đim
khi to ban đu. Các tác gi đã nghiên cu, ci tiến các phương pháp này, bng cách thêm
tính ngu nhiên vào các thut toán đ làm cho các thut toán vưt ra khi cc tr địa phương,
đi đến cc tr toàn cc. Các thut toán ngu nhiên như Stochastic Gradient Descent (SGD)
làm vic khá hiu qu trong các bài toán thc tế. Tuy nhiên, còn rt nhiu thách thc trong
gii quyết các bài toán ti ưu không li như vn đ v s hi t ca thut toán, vn đ v
đim yên nga hay cc tr địa phương.
Trong lĩnh vc thng hay hc máy, bài toán cc đi hóa phân phi hu nghim
(Maximum a Posteriori - MAP) đưc quan tâm trong rt nhiu mô hình khác nhau. MAP
đưc s dng đ ước lưng mt tham s nào đó, da trên gi thiết v mt phân phi tiên
nghim cho tham s đó (prior) các d liu quan sát đưc (likelihood). Ví d, ta quan sát
đưc d liu J và mun ưc lưng tham s D t d liu này. Đu tiên, ta gi s D có phân
phi tiên nghim đã biết trưc K D . Ta cũng gi thiết v phân phi ca d liu J khi biết
tham s D K J D . Da vào đnh Bayes, ta phân phi hu nghim (posteriori)
K D J :
L M 9N9L J D
L O
. Khi đó D đưc ưc lưng là:
D
N
: PQRSPT
M
9K D J : PQRSPT
M
9K D N KG JUDH
10
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Ta có th thy, hàm mc tiêu MAP bao gm hai thành phn là prior K D 9và likelihood
KGJUDH. Thành phn tiên nghim K D đi lưng đc trưng cho tri thc (gi thiết) ca
ta v tham s. Thành phn likelihood KGJUDH đi lưng đc trưng cho tri thc quan sát
đưc t d liu. Tham s D ước lưng đưc khi cc đi hóa phân phi hu nghim tri
thc ta thu đưc kết hp t hai thành phn trên.
Trong lun văn này, em s nghiên cu gii quyết bài toán MAP trong các mô hình ch
đề và mt phương pháp ti ưu ngu nhiên đ gii quyết nó. Mô hình ch đề đưc s dng
thành công trong vic phân tích d liu văn bn. hình ch đề giúp ta phân tích đưc
các ch đề n trong các văn bn, cũng như nhng t liên quan vi nhau cùng nói v mt
ch đề n nào đó. Vn đ chính khi nghiên cu các hình ch đề bài toán suy din.
Bài toán suy din tr li hai câu hi: ch đề ca các t và văn bn này nói v nhng
ch đề nào. Tuy nhiên, bài toán suy din cho mô hình ch đề bài toán NP-khó [24]. Do
đó các tác gi không gii trc tiếp bài toán đó mà gii bài toán xp x ca bài toán gc. Bài
toán MAP trong mô hình ch đề là mt cách đ gii quyết bài toán suy din này và đây là
bài toán ti ưu không li. Lun văn này đưa ra mt phương pháp xây dng các thut toán
ngu nhiên đ gii quyết bài toán MAP cho mô hình ch đề, đề xut mt cách thiết kế các
thut toán ngu nhiên có ch đích, da vào cách ly mu ngu nhiên ca phn tiên nghim
(prior) và phn likelihood trong hàm mc tiêu MAP.
B cc ca lun văn đưc trình bày như sau: phn 2 trình y các kiến thc liên quan
đến xác sut, thng kê, công c đồ th xác sut, các thut toán ti ưu cơ bn như Gradient
Descent, Frank-Wolfe. Phn 3 s trình bày v hình ch đề Latent Dirichlet Allocation
(LDA) [1] bài toán suy din bng MAP cho hình LDA. Phn 4 trình bày v thut
toán đề xut Generalized Online Maximum a Posteriori Estimation (G-OPE). Phn 5 là
kết qu thc nghim. Cui cùng, phn 6 là kết lun và hưng nghiên cu trong tương lai.
11
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Chương 2 - CƠ S LÝ THUYT LIÊN QUAN
Trong phn này, em xin trình bày các kiến thc liên quan đế n xác sut thng kê và ti
ưu đưc s dng trong lun văn. Đu tiên, em xin trình bày v các hàm phân phi s dng
trong hình ch đề LDA, hình đ th xác sut đưc s dng đ biu din các mô hình
ch đề ý tưng xây dng các thut toán ti ư u hay đưc s dng đ làm nn tng so
sánh vi thut toán đ xut G-OPE.
2.1 Các kiến thc v xác sut thng kê
2.1.1 Phân phi Multinomial
Gi s mt ngưi thc hin thí nghim ly ra 0 qu bóng t mt túi gm các qu bóng có
V màu khác nhau, tr li bóng sau o túi sau khi ly mt qu bóng. Các qu bóng t các
màu khác nhau là tương đương. Xét các biến ngu nhiên là s lưng qu bóng t các màu
khác nhau ly đưc W
X
9GY9 : 9;' < Z VH xác sut đ ly đưc qu bóng màu Y !
X
GY9 :
9;' < Z VH= Hàm phân b xác sut ca các biến ngu nhiên W
X
là :
! W
C
: T
C
9[9W
E
: T
E
[ Z [W
\
: T
\
: 9
0]
T
C
] Z T
\
]
!
C
^
_
Z !
\
^
`
9.ab0 9 9 T
X
\
XcC
: 0
d99efabQ.Ygb
Viết dưi dng hàm Gamma:
! W
C
: T
C
9[9W
E
: T
E
[ Z [W
\
: T
\
: 9
#G T
XX
h ;H
#GT
X
h ;H
X
9 !
X
^
i
\
XcC
Kí hiu #GTH là hàm Gamma vi biế n T. -jY9T k l9fam9# T : T n ; ].
Tính cht ca phân phi Multinomial:
o W
X
: 0 N !
X
9-PQ W
X
: 0 N !
X
N G ; n !
X
H
Phân phi Multinomial đưc s dng đ mô hình hóa các thí nghim ngu nhiên, trong đó
kết qu ca thí nghim là mt mu có th thuc mt trong nhiu lp vi xác sut đã biết.
12
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
2.1.2 Phân phi Dirichlet
Simplex +-chiu đưc đnh nghĩa p
q
: rs k t
q
u T
X
v d9wY : ;' < Z +x9 T
X
q
XcC
: ;y.
Biến ngu nhiên W : W
C
' W
E
Z W
q
k p
q
đưc gi tuân theo phân phi Dirichlet vi bc
+ v <, các tham s z
X
v d9Y : ;' < Z +, kí hiu JYQ z ' {jY9Gz : Gz
C
' Z z
q
H nếu
hàm mt đ ca nó có dng :
I T
C
' Z T
q
x z
C
' Z z
q
: 9
|G}
i
H
~
`•_
|G }
i
~
`•_
H
T
X
}
i
€C
q
XcC
Mt s tính cht ca phân phi Dirichlet :
Đặt z
: z
\
q
\cC
, ta có :
o W
X
:
z
X
z
9
-PQ W
X
:
z
X
z
n z
X
z
E
z
h ;
9
o ‚ƒ„ W
X
: " z
X
n "Gz
H
Vi9" T 9 là hàm Digamma.
Phân phi Dirichlet thư ng đưc s dng đ làm phân phi tiên nghim cho các
phân phi Multinomial trong các mô hình thng kê Bayesian.
2.2 Mô hình đ th xác sut
hình đ th xác sut (graphical models) công c để biu din các biến ngu
nhiên. Trong đó các đnh ca đ th các biến ngu nhiên, các cnh ca đ th biu din
s ph thuc ln nhau ca các biến ngu nhiên. C đồ th biu din mt phân phi đng
thi ca tt c các biến ngu nhiên đó. Trong nhiu hình thng kê, khi s lưng các
biến ngu nhiên ln s ph thuc ca các biến ngu nhiên nhiu thì đ th xác sut
công c hu hiu đ biu din toàn b mô hình. Đồ th xác sut đưc s dng nhiu trong
13
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
lý thuyết xác sut thng kê, trong đó đc bit trong thng Bayesian trong hc
máy.
Hình 1 là ví d đơn gin v hình đ th xác sut biu din h thng d đoán thi tiết
để xem c b ướt hay không. Biến Cloudy biu din bu tri đang nhiu mây hay
không vi c sut nhiu mây không nhiu mây bng nhau đu bng 0.5. Biến
Sprinkler biu din tri có sương hay không, biến này ph thuc vào biến Cloudy. Nếu
tri nhiu mây (Cloudy = True) thì xác sut đ tri sương (Sprinkler = True) là 0.9
tri không sương (Sprinkler = False) 0.1. Nếu tri không nhiu mây (Cloudy = False)
thì xác sut đ tri sương tri không sương bng nhau. Tương t như vy vi
biến tri mưa (Rain). Biến Rain ph thuc vào biến Cloudy. Cui cùng biế n c ưt
hay không (WetGrass). Biến WetGrass ph thuc vào c 2 biến Sprinkler và Rain vi xác
sut trong hình 1.
Hình 1: Ví d v đồ th xác sut
14
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
Có hai loi mô hình đ th xác sut đ th có hưng và đ th vô hưng. Các
hình đ th vô hưng đin hình là Markov networks hay Markov Random Fields, đưc s
dng ph biến trong các lĩnh vc như vt lí. Các hình đ th hưng có nhiu dng:
Bayesian networks, belief networks, các mô hình sinh, mô hình nhân quđưc s dng
ph biến trong lĩnh vc trí tu nhân to và hc máy. Trong lun văn này, em tìm hiu các
mô hình đ th có hưng liên quan đến các mô hình sinh.
!
Hình 2:Ví d v mt đ th xác sut có hưng
Hình 2 mt d v mt đ th có hưng vi 7 đnh biu din các biến ngu nhiên,
các cnh biu din quan h cha con trong lý thuyế t đ th biu din quan h ph thuc
ca các biến ngu nhiên. Nế u có cnh ni t đỉnh A sang đnh B ta nói A sinh ra B, hay B
ph thuc A. Trong hình 2, biến ngu nhiên T
ph thuc vào T
C
' T
E
' T
F
. Ta gi T
đnh
con, T
C
' T
E
' T
F
là các đnh cha ca đnh A.
Toàn b đồ th này biu din hàm phân phi đng thi ca các biến ngu nhiên là :
! T : 9! T
C
! T
E
! T
F
! T
T
C
' T
E
' T
F
!GT
UT
H!GT
UT
' T
ˆ
H
hiu ‰GTH tp các đnh cha ca đnh T thì mt đ th xác sut vi + node
T
C
' T
E
' Z T
q
biu din mt hàm phân phi đng thi:
15
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
! T : 9 !GT
\
U‰ T
\
H
q
\cC
Để thun tin cho vic biu din đ th, ta các biu din gp các biến ngu nghiên
cùng sinh ra t mt biến cha, s dng hình ch nht như sau (hình 3):
Hình 3:Cách biu din thu gn trong mô hình đ th xác sut
Mô hình đ th xác sut rt thích hp đ biu din khái nim đc lp có điu kin trong
lí thuyết xác sut. Xét 3 biến ngu nhiên P' Š' , ta nói P' Š độc lp vi điu kin nếu :
! P9 9Š' : ! P9 H
Khi đó ta kí hiu : P9 Œ Š9U9‹=
Trong đ th, các biến ngu nhiên quan sát đưc đưc hiu bng các hình tròn in
đậm, các biến n (hay các biến không quan sát đưc) đưc hiu bng các hình tròn không
in đm.
Các kiến thc trong mc này đưc tham kho trong [15].
2.3 Các thut toán ti ưu cơ bn trong hc máy
Trong mc này, em xin trình bày v ý tưng chung ca mt s thut toán ti ưu lp
hay gp trong hc máy. Ti ưu mt trong nhng lĩnh vc quan trng ca hc máy. Trong
mi mô hình, tác gi đều gii quyết mt bài toán ti ưu nào đó, thông qua các hàm mc
tiêu c th. Tùy vào tính cht ca tng hàm mc tiêu mà ta chn các phương pháp ti ưu
16
Hc viên thc hin: Vũ Văn Tú, CB160544, Lp: Thc sĩ CNTT 2016B
khác nhau. Các hàm mc tiêu thưng phc tp, nên ta không tìm đưc công thc tưng
minh để tính ra kết qu trc tiếp phi s dng các phương pháp lp đ xp x nghim
mong mun tìm kiếm.
Bài toán ti ưu là: •Ž•
•k‘
IGTH hoc •’“
•k‘
IGTH. Phương pháp lp đ tìm kiếm nghim
T
N
ti ưu có sơ đ chung như sau:
Bưc 1: Khi to giá tr T
C
k J bt kì
Bưc 2: Lp cho đến khi hi t
Tính T
/”C
: 9RGT
/
' T
/€C
' Z T
C
H
Giá tr T
/
cui cùng thu đưc là giá tr T
N
xp x cn tìm.
Các thut toán ti ưu khác nhau cách xây dng hàm RGTH. RGTH công thc cp
nht T
/”C
theo các biến T
/
' T
/€C9
' Z T
C
đã tính bưc trưc, để dãy s T
/
hi t v T
N
.
Thông thưng ta thiết kế thut toán vi T
/”C9
ch ph thuc vào T
/
. Để công thc cp
nht RGT
/
H, ti mi bước lp, ta xp x IGTH bng mt hàm nào đó aGTH d tính hơn và có
tính cht IGT
/
H 9 : aGT
/
H, sau đó minimize (hoc maximize) aGTH bng công thc tưng
minh nào đó (có th da trên phương trình gradient ca aGTH bng 0). Đ ó là công thc cho
RG TH.
Ý tưng này đưc minh ha trong thut toán ti ưu như Gradient Descent,
Expectation-Maximization, Conditional Gradient Descent (Frank-Wolfe). Cách xây dng
các thut toán này làm nn tng cơ bn đ xây dng nhiu thut toán ti ưu khác nhau.
Dưi đây em s trình bày ý tưng v cách xây dng các hàm xp x cho hàm mc tiêu IGTH
ca các thut toán ti ưu này.