多媒體資料庫(New)3rd
文章推薦指數: 80 %
多媒體資料庫(New)3rd. 1. 多媒體資料庫; 2. 提綱
- 簡介
- 多媒體資料庫的挑戰
- 多維度索引技術
- 文件資料 ...
SlideShareusescookiestoimprovefunctionalityandperformance,andtoprovideyouwithrelevantadvertising.Ifyoucontinuebrowsingthesite,youagreetotheuseofcookiesonthiswebsite.SeeourUserAgreementandPrivacyPolicy.
SlideShareusescookiestoimprovefunctionalityandperformance,andtoprovideyouwithrelevantadvertising.Ifyoucontinuebrowsingthesite,youagreetotheuseofcookiesonthiswebsite.SeeourPrivacyPolicyandUserAgreementfordetails.
Upload
Home
Explore
Login
Signup
Successfullyreportedthisslideshow.
Activateyour30dayfreetrial tounlockunlimitedreading.
多媒體資料庫(New)3rd
4
Share
KevingoTsai
•
Dec.08,2008
•
4likes
•
3,898views
DownloadNow
Download
NextSlideShares
Youarereadingapreview.
Activateyour30dayfreetrial tocontinuereading.
ContinueforFree
UpcomingSlideShare
那些年,我們一起Open的data
Loadingin…3
×
Facebook
Twitter
LinkedIn
Size(px)
Starton
ShowrelatedSlideSharesatend
Share
Email
Topclippedslide
1
1of238
多媒體資料庫(New)3rd
Dec.08,2008
•
4likes
•
3,898views
4
Share
DownloadNow
Download
Downloadtoreadoffline
Technology
Business
KevingoTsai
Follow
SoftwareEngineer
Technology
Business
那些年,我們一起Open的data
KevingoTsai
Must-have!PMTools(Nov2010)
JesseGant
PhDPresentation
mskayed
DataPreprocessing
Object-FrontierSoftwarePvt.Ltd
Classification
guest9099eb
SpatiallyCoherentLatentTopicModelForConcurrentObjectSegmentationand...
Shao-ChuanWang
DefensePowepoint
KasturiChatterjee
Lec1-Into
butest
Ch9-1.MachineLearning:Symbol-based
butest
Lecture2
butest
那些年,我們一起Open的data
KevingoTsai
Must-have!PMTools(Nov2010)
JesseGant
PhDPresentation
mskayed
DataPreprocessing
Object-FrontierSoftwarePvt.Ltd
Classification
guest9099eb
SpatiallyCoherentLatentTopicModelForConcurrentObjectSegmentationand...
Shao-ChuanWang
DefensePowepoint
KasturiChatterjee
Lec1-Into
butest
Ch9-1.MachineLearning:Symbol-based
butest
Lecture2
butest
MoreRelatedContent
YouMightAlsoLike
WALDLECTURE1
butest
Slides
butest
IntroductiontoMachineLearning
butest
KnowledgebasedexpertsystemsinBioinformatics
RadwenAniba
얼굴검출기법감성언어인식기법
cyberemotions
Iccv2009recognitionandlearningobjectcategoriesp1c01-classicalmethods
zukun
Cvpr2007objectcategoryrecognitionp3-discriminativemodels
zukun
Cvpr2010opensourcevisionsoftware,introandtrainingpartvopencvandr...
zukun
Podobnostníhledánívnetextovýchdatech(PavelZezula)
Národnítechnickáknihovna(NTK)
ADAPTINGMETRICSFORMUSICSIMILARITYUSINGCOMPARATIVERATINGS
DanielWolff
Fcvbiocv_cottrell
zukun
Fcvbiocv_cottrell
zukun
ScaledEigenAppearanceandLikelihoodPrunningforLargeScaleVideoDuplica...
UnitedStatesAirForceAcademy
Mit6870orsulecture2
zukun
Dbm630lecture05
TokyoInstituteofTechnology
Semantic3DTVContentAnalysisandDescription
DistinguishedLecturerSeries-LeonTheMathematician
IJERD(www.ijerd.com)InternationalJournalofEngineeringResearchandDevel...
IJERDEditor
1617bag_words
khawarbashir
Chapter-5DataMiningConceptsandTechniques2ndEdslidesHan&Kamber
error007
K-Means,itsVariantsanditsApplications
VaradMeru
Associations1
mancnilu
Preprocessing
mmuthuraj
Graphminingseminar_2009
HouwLiongThe
bag-of-wordsmodels
XiaotaoZou
MiningFrequentPatterns,AssociationandCorrelations
JustinCletus
BasicsofMachineLearning
PranavChalla
DMLecture3
asad199
My3prep
asad199
DataMining:ConceptsandTechniques_Chapter6:MiningFrequentPatterns,...
SalahAmean
AnIn-DepthEvaluationofMultimodalVideoGenreCategorization
IonutMironica
Lecture10mingyang-facerecognitionsystems
mustafasarac
DeepLearning-인공지능기계학습의새로운트랜드:김인중
datasciencekorea
1.11.associationmining3
Krish_ver2
Conceptbasedshorttextclassificationandranking
祺傑林
DMTM2015-13Naivebayes,NearestNeighboursandOtherMethods
PierLucaLanzi
Textclustering
CEG,AnnaUniversity,Chennai
gilbert_iccv11_paper
AndrewGilbert
Report
ChrisWatts
AJuliapackageforiterativeSVDswithapplicationstogenomicsdataanalysis
JiahaoChen
Datapreprocessing
TonyNguyen
RelatedBooks
Freewitha30daytrialfromScribd
Seeall
SoYouWanttoStartaPodcast:FindingYourVoice,TellingYourStory,andBuildingaCommunityThatWillListen
KristenMeinzer
(3.5/5)
Free
Bezonomics:HowAmazonIsChangingOurLivesandWhattheWorld'sBestCompaniesAreLearningfromIt
BrianDumaine
(4.5/5)
Free
Autonomy:TheQuesttoBuildtheDriverlessCar—AndHowItWillReshapeOurWorld
LawrenceD.Burns
(5/5)
Free
NoFilter:TheInsideStoryofInstagram
SarahFrier
(4.5/5)
Free
TalktoMe:HowVoiceComputingWillTransformtheWayWeLive,Work,andThink
JamesVlahos
(4/5)
Free
SAM:OneRobot,aDozenEngineers,andtheRacetoRevolutionizetheWayWeBuild
JonathanWaldman
(5/5)
Free
FromGutenbergtoGoogle:TheHistoryofOurFuture
TomWheeler
(3.5/5)
Free
TheFutureIsFasterThanYouThink:HowConvergingTechnologiesAreTransformingBusiness,Industries,andOurLives
PeterH.Diamandis
(4.5/5)
Free
LifeAfterGoogle:TheFallofBigDataandtheRiseoftheBlockchainEconomy
GeorgeGilder
(4/5)
Free
EverybodyLies:BigData,NewData,andWhattheInternetCanTellUsAboutWhoWeReallyAre
SethStephens-Davidowitz
(4.5/5)
Free
FuturePresence:HowVirtualRealityIsChangingHumanConnection,Intimacy,andtheLimitsofOrdinaryLife
PeterRubin
(4/5)
Free
LiveWorkWorkWorkDie:AJourneyintotheSavageHeartofSiliconValley
CoreyPein
(4.5/5)
Free
Driven:TheRacetoCreatetheAutonomousCar
AlexDavies
(4.5/5)
Free
MadeinChina:APrisoner,anSOSLetter,andtheHiddenCostofAmerica'sCheapGoods
AmeliaPang
(4.5/5)
Free
HotSeat:WhatILearnedLeadingaGreatAmericanCompany
JeffImmelt
(5/5)
Free
LadiesGetPaid:TheUltimateGuidetoBreakingBarriers,OwningYourWorth,andTakingCommandofYourCareer
ClaireWasserman
(5/5)
Free
RelatedAudiobooks
Freewitha30daytrialfromScribd
Seeall
DignityinaDigitalAge:MakingTechWorkforAllofUs
RoKhanna
(4/5)
Free
IfThen:HowtheSimulmaticsCorporationInventedtheFuture
JillLepore
(4.5/5)
Free
Liftoff:ElonMuskandtheDesperateEarlyDaysThatLaunchedSpaceX
EricBerger
(5/5)
Free
TheScienceofTimeTravel:TheSecretsBehindTimeMachines,TimeLoops,AlternateRealities,andMore!
ElizabethHowell
(3/5)
Free
TheQuietZone:UnravelingtheMysteryofaTownSuspendedinSilence
StephenKurczy
(4.5/5)
Free
TheWiresofWar:TechnologyandtheGlobalStruggleforPower
JacobHelberg
(4.5/5)
Free
SystemError:WhereBigTechWentWrongandHowWeCanReboot
RobReich
(4.5/5)
Free
AnUglyTruth:InsideFacebook’sBattleforDomination
SheeraFrenkel
(4.5/5)
Free
ABriefHistoryofMotion:FromtheWheel,totheCar,toWhatComesNext
TomStandage
(4.5/5)
Free
ThePlayersBall:AGenius,aConMan,andtheSecretHistoryoftheInternet'sRise
DavidKushner
(4.5/5)
Free
BitcoinBillionaires:ATrueStoryofGenius,Betrayal,andRedemption
BenMezrich
(4.5/5)
Free
DigitalRenaissance:WhatDataandEconomicsTellUsabouttheFutureofPopularCulture
JoelWaldfogel
(3.5/5)
Free
UserFriendly:HowtheHiddenRulesofDesignAreChangingtheWayWeLive,Work,andPlay
CliffKuang
(4.5/5)
Free
AWorldWithoutWork:Technology,Automation,andHowWeShouldRespond
DanielSusskind
(4.5/5)
Free
LeanOut:TheTruthAboutWomen,Power,andtheWorkplace
MarissaOrr
(4.5/5)
Free
Blockchain:TheNextEverything
StephenPWilliams
(4/5)
Free
多媒體資料庫(New)3rd
1.
多媒體資料庫
2.
提綱
- 簡介
- 多媒體資料庫的挑戰
- 多維度索引技術
- 文件資料庫
- 影像資料庫
- 音訊資料庫
- 視訊資料庫
- 多媒體資料與傳統資料庫之比較
- 資料內容
- 傳統資料庫
- 以文字的方式儲存,常以多個屬性描述一個實體或物件
- 多媒體資料庫
- 為涵義豐富的媒體,內容無法單純以多個屬性將其描述
- 資料展示
- 傳統資料庫
- 文字,表單
- 多媒體資料庫
- 需要更豐富的視覺聽覺之展示
- 範例
- 將圖片以傳統資料庫的方式處理儲存
- 可下達的查詢
- 找出XXX所畫的圖片
- 找出在1945~1955年,由OOO所繪製的圖片
- 無法處理的查詢
- 找出與此圖片相類似的圖片
- 找出左上角有一台紅色車子的圖片
- 多媒體資料庫必須能提供
- 有效率之多媒體資料之儲存
- 提供內涵式資料的查詢
- 與媒體本身內容相關之查詢
- 多樣性的多媒體資料之展示
- 大量資料之處理
- 多媒體資料所需之儲存空間比一般資料大得多
- 多維資料之索引
- 快速的搜尋技巧
- 相似度之計算
- 容錯式的查詢
- 資料之展示
- 如何將使用者查詢的結果快速正確的回傳,是很重要的問題
- 資料量大,逐筆搜尋比對耗費過多的時間
- 避免逐筆比對搜尋
- 對資料建立索引加快查詢
- 索引可視為一種分類的指標,依據索引的指示,即可找到與查詢相關的資料。
- 在傳統資料庫中常見的索引結構
- B+-tree
- 最廣為使用的索引結構
- Hash
- Statichashing
- Dynamichashing
- Gridfile
- Bitmapindex
- B+-Tree為一樹結構,且符合下列特性
- 為一棵平衡樹,所有的葉節點到根節點的路徑長度皆相同
- 對於所有的非根節點以及非葉節點,必須擁有n/2~n個子節點
- 葉節點必須擁有(n-1)/2~n-1值
- Ki為搜尋值
- Pi為指向子節點的指標(fornonleafnodes)或為指向資料的指標(forleafnodes).
- 節點內的搜尋值為排序過的K1
- 葉節點之特性
- 對於i=1,2,...,n-1,i不是指向一個擁有搜尋值Ki的資料記錄就是指向一個存取單元((bucket),而這個存取單元只包含擁有搜尋值Ki的資料
- Pn指向下一個葉節點
- 在被Pi指到的搜尋樹內所有的搜尋值皆小於Ki-1
- 在被Pi指到的搜尋樹內所有的搜尋值皆大於或等於Ki
- B+-tree對於傳統表單資料庫的搜尋十分有效率,且廣為被使用
- 然而
- B+-tree為單一維度的索引結構
- 多媒體資料的特性
- 多媒體資料的特徵
- 文件
- 內容
- 關鍵字
- 圖片
- 主要構成顏色
- 包含物件
- 物件大小
- 顏色分佈
- 紋理特徵…
- 音樂
- 節拍
- 和絃
- 音調…
- 影片
- 物體之移動軌跡
- 包含物件
- 顏色…
- 可以依內涵資訊為查詢條件
- 找出與某張圖相像的圖
- 找出包含類似某段旋律之歌曲
- 找出有機車飛越火車的影片片段
- 一個多媒體資料是由多個特徵所描述,可由多維資料表示
- 然而B-tree,B+-tree
- 僅能對單一維度的資料做索引
- 不適用於多維度資料
- 如何對多維度資料建立索引加速查詢,對多媒體資料的搜尋十分重要。
- k-dtree
- 用來儲存k–dimension的資料
- 在一個層級(level)中只比一個維度的資料
- 在節點N所在層級比較的維度上,在節點N所指到的左子樹內所有的資料其該維度的值皆比節點N該維度的值小,而右子樹的值則皆大於或等於節點N該維度的值
- 範例
- 隨堂練習
- 考慮當k>2時的k-dtree
- 自己試試看
- 將A(30,24,58),B(46,78,33),C(20,33,15),D(58,40,50),E(40,88,56),F(38,54,44)插入k-dtree中
- 請利用你所建立的k-dtree,找出與X(34,50,46)距離在15以內的點
- 刪除時如何處理?
- 優點
- 簡單
- 缺點
- 樹的高度會因資料插入順序的不同而不同
- 很可能造成一棵歪斜樹
- 搜尋的效率將會變得十分差
- 資料刪除的過程較為複雜
- Mx-quadtree
- 樹的形狀與插入的點的個樹以及順序無關。
- 設計者必須決定一個k,而k一旦決定,則無法更改。
- 整個地圖會被切成個格子
- 刪除與插入的步驟十分簡單
- 範例
- 假設k=2
- 地圖被切成個格子
- 將A,B,C,D四個點放入MX-quad-tree中
- R-tree
- 為一棵平衡的樹
- 針對大量資料的儲存十分有用
- 可減少大量的磁碟存取
- 一個R-tree的節點有k個指標
- 除了根節點與葉節點外,每一個節點必須包含至k個非空的指標
- 控制磁碟存取的次數
- 葉節點包含真正的資料
- 中間節點包含真正資料的群組輪廓,以長方形來表示
- 左上角以及右下角
- 可為多維度
- 插入與刪除包括了節點的分裂以及整合,較為複雜。
- 範例
- 總共有八個物件
- 兩維空間
- 假設k=3
- 刪除p2
- 找出包含P2的MBR
- R3不滿足R-tree的定義(underflow)
- 與鄰近的Boundingrectangle合併
- 將R3和R4重新整理,修改個別的左上角以及右上角之值
- 一個多媒體物件會包含的特徵為多維的
- 假設一張圖片我們以平均的R(紅),G(綠),B(藍)當為特徵
- 特徵空間為三維
- 範例
- 假設資料庫內有十張圖
- 有下列三個查詢
- 我們得到下列的R,G,B的平均值
- Case1:假設我們要找到與查詢圖片Q1相似度在0.15內的圖片
- Q1=(0.478,0.541,0.753),r=0.15
- 資料庫內找出個個維度與查詢最近的值
- (0.451,0.447,0.561)
- (|0.478-0.451|,|0.541-0.447|,|0.753-0.561|)
- =>(0.027,0.094,0.192)
- 所以沒有符合查詢的資料
- Case2:假設我們要找到與查詢圖片Q2相似度在0.02內的圖片
- Q2=(0.302,0.310,0.416),r=0.02
- 第一步:在資料庫內找出個個維度與查詢最近的值
- (0.318,0.302,0.400)
- (|0.302-0.318|,|0.310-0.302|,|0.416-0.400|)
- 第二步驟:由第一個維度開始檢查,並將容許的錯誤減掉之前已用到的額度
- 第一維可用的誤差額度為:0.02
- 第二維可用的誤差額度為:(0.022-0.0162)1/2
- 第三維可用的誤差額度為:(0.022-0.0162-0.0082)1/2
- Case3:假設我們要找到與查詢圖片Q3相似度在0.05內的圖片
- Q3=(0.302,0.223,0.161),r=0.05
- (|0.302-0.318|,|0.223-0.200|,|0.161-0.161|)
- =>(0.016,0.023,0)G>R>B
- 第一步驟無法決定資料庫內沒有欲查詢的資料
- 搜尋G上的索引,找出在0.223+-0.05=[0.173,0.273]範圍內的圖
- {P7,P6,P2}
- 搜尋R上的索引,找出在0.302+-(0.044)=[0.258,0.346]範圍內的圖
- {P2,P8}
- 搜尋B上的索引,找出在0.161+-0.041=[0.120,0.202]範圍內的圖
- {P2,P5,P9}
- 將結果整合,得到P2為符合查詢之資料
- 導論
- 文件內容的分析
- 同意字(Synonymy)
- 一辭多義(Polysemy)
- 搜尋結果之評估
- Precision
- 找到的文件正確的機率
- Recall
- 相關的文件被找到的機率
- Precision=
- Recall=
- Precision/recall之計算範例
- 請探討precision/recall之關係
- 文件內容之描述
- Stoplists
- 文件內可被忽略的字,如:a,the,he…
- Wordstems
- 同一個字各種不同之時態或單複數等等
- Frequencytables
- 查詢處理
- 文件相關性之計算
- 字詞距離
- Cosine距離
- 查詢型態
- 找出包含某些字詞的文件
- 找出包含某些字詞但不包含另一些字詞的文件
- 找出離查詢向量最近的文件
- 找出離查詢向量最近的前k個文件
- 找出與查詢向量距離之內的文件
- 使用索引
- R-tree
- 不適用於高維索引結構
- TV-tree
- 與R-tree類似,但在一各節點,只考慮部分維度的關係
- Invertedlist
- Signaturefiles
- Invertedlist(反轉串列)
- 以字詞為主所形成的反轉表
- 以table為例
- Sex:d1
- Drug:d1,d3,d4
- Videotape:d1,d4
- 搜尋範例以及型態
- and,or,not
- 無法處理相似度查詢
- 缺點
- Size大
- 壓縮技巧
- Signaturefiles
- 每個關鍵字有它所對應的code
- 對一文件而言,該文件的signature即為將其所包含的關鍵字的codesuperimpose在一起
- 搜尋範例
- 可處理之查詢型態
- And,Or
- Not?
- 討論
- R-tree,TV-tree可處理相似度的查詢
- Invertedindices,Signaturefiles無法處理相似度的查詢,只能處理包含某些字詞的查詢
- Signaturefiles不適合處理不包含某個(些)字詞的查詢
- 請舉例說明
- R-tree不適合高維度的資料
- 查詢範例
- 範例一:找出與這張圖相像的圖片
- 範例二:找出左上角有一個紅色方形,而圖形的下方為藍色的所有圖片
- 可代表一張影像的資訊
- 與影像內涵資訊無關之資訊
- 作者
- 完成時間
- 完成地點
- etc..
- 與影像內涵資訊相關的特徵
- 顏色分佈
- 可以colorhistogram表示
- 紋理
- 內含物件
- 形狀
- 顏色
- 大小
- 位置
- 主要構成顏色
- Etc.
- 由關鍵字查詢(QueryByKeyword)
- 以文字屬性描述每張影像,可以對個個屬性建構索引,並可以SQL的方式下查詢
- 以範例查詢(QueryByExample(QBE)):
- 使用者對系統展示一張範例圖,系統則根據資料庫內每張圖與這張範例圖的相似度決定回傳的答案
- 查詢型態
- 找出離查詢範例最近的影像
- 找出離查詢範例最近的前k個影像
- 找出與查詢範例距離之內的影像
- ColorSimilarity
- TextureSimilarity
- ShapeSimilarity
- Object&Relationshipsimilarity
- 顏色佔的比例
- Ex:R:20%,G:50%,B:30%
- 顏色分布圖(Colorhistogram)
- Dhist(I,Q)=(h(I)-h(Q))TA(h(I)-h(Q))
- Aisasimilaritymatrixcolorsthatareverysimilarshouldhavesimilarityvaluesclosetoone.
- Colorlayoutmatching:compareseachgridsquareofthequerytothecorrespondinggridsquareofapotentialmatchingimageandcombinestheresultsintoasingleimagedistance
- whereCI(g)representsthecoloringridsquaregofadatabaseimageIandCQ(g)representsthecolorinthecorrespondinggridsquaregofthequeryimageQ.somesuitablerepresentationsofcolorare
- Mean
- Meanandstandarddeviation
- Multi-binhistogram
- Pickandclick
- SupposeT(I)isatexturedescriptionvectorwhichisavectorofnumbersthatsummarizesthetextureinagivenimageI(forexample:Lawstextureenergymeasures),thenthetexturedistancemeasureisdefinedby
- Texturelayout
- ShapeHistogram
- BoundaryMatching
- SketchMatching
- 以內容來看,三張圖相像嗎?
- 顏色資訊
- 位置資訊
- 顏色與位置資訊的取得
- 將圖切成一個一個的格子
- 找出每個格子的代表色
- 相鄰格子有相同的顏色,及組合成更大的格子
- 最後的大區塊的顏色,位置及形狀是將來比對上所使用的重大資訊。
- 兩張圖要相似有哪些因素是可能被使用者考慮的?
- 顏色配置
- 顏色分布
- 物件位置
- 物件大小
- 物件形狀
- 聽看看下面幾首音樂或音樂片段,你知道歌名是什麼嗎?Music12345678910
- 你是怎麼辦識出這首歌的呢?若要讓電腦幫我們做同樣的事,要怎麼設計呢?
- StaticMusicInformation如調號、拍號等
- AcousticalFeature如loudness、pitch等
- ThematicFeature如melodies、rhythms及chords例“sol-sol-sol-mi”、”0.5-0.5-0.5-2”及“C-Am-Dm-G7”
- StructuralFeature古典音樂格式的二個基本規則hierarchicalrule及repetitionrule
- 相對音感vs絕對音感—旋律的位移
- 考慮以絕對音感比對所會造成的問題
- 升key,降key所發生的問題
- 節拍取樣也有相同的問題
- 依完整段落取pattern
- 多音軌的取樣問題
- 將特徵取出後,依適當的編碼方式將特徵標碼
- 能應付音調的升降
- 能應付節拍的快慢
- 要讓聽起來像的音樂,其編碼出來的code之間的距離也要近
- 利用重複出現的重要音調代表某首歌
- Hierarchicalrulemusicobject->movements->Sentences->phrases->figures
- Repetitionrule如“C6-Ab5-Ab5-C6”及“F6-C6-C6-Eb6”
- ForasubstringXofasequenceofnotesS,ifXappearsmorethanonceinS,wecallXarepeatingpatternofS.TherepeatingfrequencyoftherepeatingpatternX,denotedasfreq(X),isthenumberofappearancesofXinS.ThelengthoftherepeatingpatternX,denoted|X|,isthenumberofnotesinX.
- “C-D-E-F-C-D-E-C-D-E-F”RP:RepeatingPatternRPF:RepeatingPatternFrequency
- nontrival的定義ArepeatingpatternXisnontrivialifandonlyiftheredoesnotexistanotherrepeatingpatternYsuchthatfreq(X)=freq(Y)andXisasubstringofY.
- 實例上頁的10個RP中,只有“C-D-E-F”及”C-D-E”為nontrival
- Phrase
- MelodystringS=“C6-Ab5-Ab5-C6-C6-Ab5-Ab5-C6-Db5-c6-Bb5-C6”
- RepeatingPatterns
- FindallRPsandtheirRFs.
- 定義candidatesetCS其格式為(pattern,rep_count,sub_count)
- CS一開始為空集合,接下來根據T來計算及insertRP到CS內
- 因為條件有(Ti,j=1)or(Ti,j>1)及(T(i+1),(j+1)=0)or(T(i+1),(j+1)<>0),所以有以下四種情形
- Case1:(Ti,j=1)and(T(i+1),(j+1)=0)例T1,4=1,T2,5=0insert(“C6”,1,0)intoCS
- Case2:(Ti,j=1)and(T(i+1),(j+1)<>0)例T1,5=1,T2,6=2modify(“C6”,1,0)into(“C6”,2,1)
- Case3:(Ti,j>1)and(T(i+1),(j+1)<>0)例T2,6=2,T3,7=3insert(“C6-Ab5”,1,1),(“Ab5”,1,1)intoCS
- Case4:(Ti,j>1)and(T(i+1),(j+1)=0)例T4,8=4,T5,9=0insert(C6-Ab5-Ab5-C6”,1,0),(“Ab5-Ab5-C6”,1,1)and(“Ab5-C6”,1,1)intoCSandchange(“C6”,6,1)into(“C6”,7,2)
- 計算RFrep_count=0.5f(f-1)即f=((1+SQRT(1+8*rep_count))/2例如本例中(“C6”,15,1),即C6的rep_count=15,所以f=((1+SQRT(1+8x15))/2=6同理“Ab5”的RF為4,“C6-Ab5-Ab5-C6”的RF為2
- Melodystring“C-D-E-F-C-D-E-C-D-E-F”
- 第一步:找出所有長度為1的RPs,並記為{X,freq(X),(position1,position2,…)}如本例可找到{“C”,3,(1,5,8)},{“D”,3,(2,6,9)},{E”,3,(3,7,10)},and{“F”,2,(4,11)}
- 接下來長度為2的RPs可由上面的RPs經joining(記為“∞”)而得例如若要找“C-D”,已知{“C”,3,(1,5,8)},{“D”,3,(2,6,9)}則可確定“C-D”亦出現在(1,5,8),可表示為{“C”,3,(1,5,8)}∞{“D”,3,(2,6,9)}={“C-D”,3,(1,5,8)}
- 同理{“D”,3,(2,6,9)}∞{“E”,3,(3,7,10)}={“D-E”,3,(2,6,9)}{“E”,3,(3,7,10)}∞{“F”,2,(4,11)}={“E-F”,2,(3,10)}
- 而長度為4的,可由長度為2的join而得如{“C-D”,3,(1,5,8)}∞{“E-F”,2,(3,10)}={“C-D-E-F”,2,(1,8)}
- 長度為3的,因為freq(“C-D-E-F”)=freq(“E-F”)=2,可知不只“E-F”是trivial,”D-E-F”也是(否則freq(“E-F”)要大於2)而{“C-D”,3,(1,5,8)}∞{“D-E”,3,(2,6,9)}={“C-D-E”,3,(1,5,8)}且freq(“C-D-E”)>freq(“C-D-E-F”)所以“C-D-E”為nontrivial
- 最後,得知此例的nontrivialrepeatingpatterns為“C-D-E-F”及“C-D-E”
- 相對音感vs絕對音感—旋律的位移
- 依完整段落取pattern
- 不同音樂格式的轉換
- 問題—重要卻沒重覆的feature
- 內容組織
- 使用者會對哪一部分的內容感興趣
- 如何儲存這部分的內容,使得查詢處理能很有效率的被執行
- 如何設計查詢語言,與傳統的SQL有何不同
- 影片的內容可自動的被取出來嗎?
- 物件
- 單純形狀的描述
- 可做到自動化
- 有意義的物件描述
- 人物
- 男主角,女主角…
- 動物
- 豬,貓,狗…
- 非生物
- 皮箱,鑰匙…
- 幾乎不可能做到自動化
- 活動
- 單純描述
- 物件移動軌跡
- 如何將軌跡編碼成電腦可比對的code為一個很重要的課題
- 可做到自動化
- 含有意義的行為描述
- 車禍,甲男把皮箱交給乙女…
- 必須用單純描述做為基礎描述
- 不容易做到完全自動化
- 兩種資訊
- 靜態
- 將一個frame視為一張圖片
- 利用圖片搜尋技巧
- 動態
- 將連續frame視為一個動作
- 物件移動軌跡必須被考慮
- 靜態資訊
- 動態資訊
- 移動軌跡
- 影片分析
- Shot
- 單一連續的鏡頭所拍攝之影片段落
- 組成影片的單位
- 同一個shot內的frame內容類似
- 可以在一個shot中找出其代表的frame,來表示整個shot
- Shot偵測
- 利用顏色分佈的改變偵測shot的界線(boundary)
- 可自動化,但可能會因顏色的突然改變而誤找
- 目前shotsegmentation工具可以達到一各十分高的正確率(>95%)
- 場景(SCENE)
- 由多個描述相同事件的shot所組成
- 可當作查詢的單位
- 物件移動軌跡
- 找出物體移動的軌跡,可代表某一事件
- 可下達語意式的查詢
- 找出包含天空以及海的圖片
- 找出有飛機飛過天空的影片
- 以低階(lowlevel)特徵值的關聯,找出媒體之內涵意義
- 半自動分類
- Classification
- Associationpatternmining
- Concept與Semanticnetwork
- 目標
- 預測資料之類別
- 步驟
- 建立資料分類模型
- 根據訓練資料集(trainingset)
- 評估資料分類模型的準確度
- 根據測試資料集(testingdata)
- 資料分類預測
- 演算法
- 決策樹(decisiontree)
- BayesianBeliefNetworks
- k-nearestneighborclassifier
- case-basedreasoning
- Geneticalgorithm
- Roughsetapproach
- Fuzzysetapproaches
- NeuralNetwork
- AnunseensampleX=
- P(X|p)·P(p)=P(rain|p)·P(hot|p)·P(high|p)·P(false|p)·P(p)=3/9·2/9·3/9·6/9·9/14=0.010582
- P(X|n)·P(n)=P(rain|n)·P(hot|n)·P(high|n)·P(false|n)·P(n)=2/5·2/5·4/5·2/5·5/14=0.018286
- SampleXisclassifiedinclassn
- Roughsetsareusedtoapproximatelyor“roughly”defineequivalentclasses
- AroughsetforagivenclassCisapproximatedbytwosets:a
- lowerapproximation(certaintobeinC)
- upperapproximation(cannotbedescribedasnotbelongingtoC)
- 目標
- 尋找項目(item)或物件間的關聯性
- 關聯性
- 一起出現的次數要夠多(support)
- 伴隨出現之條件機率值要夠大(confidence)
- 演算法
- Apriorialgorithm
- Latticeapproach
- FP-tree
- ForruleAC:
- support=support({AC})=50%
- confidence=support({AC})/support({A})=66.6%
- TheAprioriprinciple:
- Anysubsetofafrequentitemsetmustbefrequent
- JoinStep:CkisgeneratedbyjoiningLk-1withitself
- PruneStep:Any(k-1)-itemsetthatisnotfrequentcannotbeasubsetofafrequentk-itemset
- Pseudo-code:
- Ck:Candidateitemsetofsizek
- Lk:frequentitemsetofsizek
- L1={frequentitems};
- for(k=1;Lk!=;k++)dobegin
- Ck+1=candidatesgeneratedfromLk;
- foreachtransactiontindatabasedo
- incrementthecountofallcandidatesinCk+1thatarecontainedint
- Lk+1=candidatesinCk+1withmin_support
- end
- returnkLk;
- 把一大型資料庫壓縮至一緊實的資料結構
- FP-tree
- 只包含探勘關聯式樣式所需之相關資料
- 避免花費高昂的資料庫掃描
- Steps:
- ScanDBonce,findfrequent1-itemset(singleitempattern)
- Orderfrequentitemsinfrequencydescendingorder
- ScanDBagain,constructFP-tree
- 對FP-tree內的每個node,建置conditionalpatternbase
- 對每一個conditionalpattern-base建置conditionalFP-tree
- 重複上面步驟,一直到
- FP-tree只剩下單一路徑
- m-conditionalpatternbase:
- fca:2,fcab:1
- 傳統Associationpatternmining幾乎都是找出項目和項目間的關聯性
- 在多媒體應用中
- 互斥之關係亦十分重要
- 可幫助分類的準確性
- 概念(concepts)
- 知識表達之基本觀念
- Semanticnotionsoftheobjectsintheworld
- 概念之間的關係
- 多重解析度(multi-resolution)
- Semanticnetwork
- 節點
- 物件,觀念或狀態
- 連結
- 節點之間的關聯
- 參考資料
- V.S.Subrahmanian,PrinciplesofMultimediaDatabaseSystems,MorganKaufmann.
- C.Y.Tsai,A.L.P.ChenandK.Essig,”EfficientImageRetrievalApproachesforDifferentSimilarityRequirements”,Proc.SPIEConferenceonStorageandRetrievalforImageandVideoDatabases,2000
- JiaweiHanandMichelineKamber,DataMining:ConceptsandTechniques,MorganKaufmann,2000.
- Usingkeywordsorfreetexttodescribethenecessarysemanticobjectsisnotsufficient.
- Theissuesthatneedtobeaddressedis
- therepresentationofvideoinformation
- theorganizationofthisinformation
- user-friendlyrepresentation
- Weexploitthe2languages
- Onefordefiningtheschema(i.e.the
- structure)
- Theotherforqueryingthroughschema
- And2layersforrepresentingvideo`sconceptualcontent
- Objectlayer
- Schemalayer
- Objectlayer:collectobjectsofinterest,theirdescriptionandrelationamongthem.Objectsinvideosequencearerepresentedasvisualentities.
- Schemalayer:intendtocapturethestructureandknowledgeforvideoretrieval.Visualentitiescanbeclassifiedintohierarchicalstructure.
- QueryingaDBmeansretrievingstoredobjectsthatsatisfycertainconditionsorqualificationsandhenceareinterestingforauser.
- InOODB,classesareusedtorepresentsetsofobjects.
- Queriesarerepresentedasconceptsinourabstractlanguage.
- Thesyntaxandsemanticsofaconceptlanguageformakingqueries
- “SequencesofmoviesdirectedbyKevinCostnerinwhichheisalsoanactor”
- “thesetofmovieswhosedirectorsarealsoproducersofsomefilms”
- Videosisn`tjustasequenceofimages.Itaddthetemporaldimension.
- Anapproachforsemanticannotationofsportsvideosthatincludeseveraldifferentsportsandevennon-sportscontent
- Thereisagrowinginterestinvideodatabaseandfordealingwithaccessproblems.
- Oneofthecentralproblemsinthecreationofrobustandscalablesystemsformanipulatingvideoinformationliesinrepresentingvideocontent
- Thisframeworkisappropriateforsupportingconceptualandintensionalqueries
- Beabletoperformexactaswellaspartialorfuzzymatching
- somephysicalfeatures:color,objects’sshape…ect.
- Introduction
- Basicconcepts
- Neighborhoodgeneration
- Partitioningintoexactsearch
- Intermediatepartitioning
- summarization
- Definition
- givenalongtextT1…..noflengthnandacomparativelyshortpatternP1…..moflengthm,bothsequencesoveranalphabetΣofsizeσ,findthetextpositionsthatmatchthepatternwithatmostk“errors”.
- Applications
- Retrievingmusicalpassagessimilartoasample
- FindingDNAsubsequencesafterpossiblemutations
- Searchingtextunderthepresenceoftypingorspellingerrors
- Introduction
- Basicconcepts
- Neighborhoodgeneration
- Partitioningintoexactsearch
- Intermediatepartitioning
- summarization
- Introduction
- Basicconcepts
- Neighborhoodgeneration
- Partitioningintoexactsearch
- Intermediatepartitioning
- summarization
- Introduction
- Basicconcepts
- Neighborhoodgeneration
- Partitioningintoexactsearch
- Intermediatepartitioning
- summarization
- Introduction
- Basicconcepts
- Neighborhoodgeneration
- Partitioningintoexactsearch
- Intermediatepartitioning
- summarization
- Introduction
- Basicconcepts
- Neighborhoodgeneration
- Partitioningintoexactsearch
- Intermediatepartitioning
- summarization
- Introduction
- Detector-baseprocessing
- Probabilisticmultimediaretrieval
- Interactiveexperiment
- Lazyusers
- Discussion
- Conclusion
- Indexing
- K-dtree,pointquadtree,MX-quadtree,R-tree,suffix-tree,TV-tree……
- Determinedbydatabasedesigner.
- Similarity
- Nostandard.
- Howsimilarisdecidebyuser.
- Facts1:
- Almostofenduserknownothingabout“Query”.
- Facts2:
- Whattheywantmayonlyaconcept,cannotclearlytodescript.
- Facts3:
- Userslikeselection,notquestion.
- Usetwocomplementaryautomaticapproach:
- Visualcontent
- Transcript
- Theexperimentfocusonrevealingrelationshipsbetween:
- Differentmodalities
- Theamountofhumanprocessing
- Thequalityofrersults
- Architectureforautomaticsyste
- Detectorforexactqueriesthatyieldyes/noanswerdependingifasetofpredicatesissatisfied.
- Detectorforapproximatequeriesthatyieldameasurethatexpresseshowsimilaris.
- Cameratechniquedetection
- zoom,pan,tilt…….
- Facedetector
- noface,1-face,2-faces…5-faces,many-faces
- Captionretrieval
- Textsegmentation,OCR,fuzzystringmatching
- Monologuedetection
- Shotshouldcontainspeech
- Shotshouldhaveastaticorunknowncameratechnique
- Shotshouldhaveaminimumlength
- Detectorsbaseoncolorinvariantfeatures
- Keyframesstorewithcolorhistogram
- Weassumeourdocumentsareshotsfromvideo.
- Modelsofdiscretesignals(i.e.text).
- Mixtureofdiscreteprobabilitymeasures
- Modelsofcontinuoussignals(i.e.image).
- Mixtureofcontinuousprobabilitymeasures
- UsingBayes’rule:
- Ifaqueryconsistsofseveralindependentparts(e.g.atextualQtandvisualpartQv)
- Hierarchicaldatamodelofvideo
- Textretrieval
- UsingSphinx3speechrecognitionsystemfromCarnegieMellonUniversity
- Inputquerykeyword
- Retrievaltoshotslevel
- Imageretrieval
- Retrievingthekeyframesofshots
- Cutkeyframesofeachshotsintoblocksof8x8pixels
- PerformbyDiscreteCosineTransform(DCT),whichusedintheJPEGcompressionstandard.
- Topiclists.
- http://www-nlpir.nist.gov/projects/t01v/topicsoverview.html
- Topic33:Whitefort
- Topic19:Lunarrover
- Topic8:Jupiter
- Topic25:Starwar
- Color-basedretrievaltechniqueisnotusefulinthiscase
- ByRun4:
- Allowusertomakingexplicittheirownworldknowledge:inscenesonthemoon,theskyisblack.
- Atfirstthough,thisquerymayseemtobeeasytosolve.
- Butitisapparentthatcolorsindifferentphotos.
- Usingthreecolor-histogramandtheirinterrelationships.
- Textretrieval:(ifyouknowthename)
- Thefirstfilterselectsonlythoseimagesthathavesufficientamountofgoldencontent.
- Secondly,asetoffiltersreducesthedata-setbyselectingthoseimagesthatcontainthecolor-setsshown.
- Lazyusersidentifyresultsetsinsteadofcorrectanswer.(soourinteractiveresultsarenot100%precision.)
- Thecombinationstrategiesusedtoconstructrun5consistedof:
- Howvideoretrievalsystemsshouldbeevaluated.
- Theinhomogeneityofthetopics
- “sailboatonthebeach”vs.“yachtonthesea”
- Thelowqualityofthedata
- photosofJupiter
- Theevaluationmeasuresused
- Ourevaluationdemonstratestheimportanceofcombiningvarioustechniquestoanalyzethemultiplemodalities.
- theoptimaltechniquedependsalwaysonthequery.
- Userinteractionisstillrequiredtodecideuponagoodstrategy.
- Introduction
- motionindexing
- MotionActivityMap---MAM
- DefinitionofMAM
- GenerationofMAM
- OrganizationofMAMs
- Experimentalresults
- Conclusion
- Tofindavideoindexingtechniquewhichcouldextractcrucialinformationfromvideosforefficientvisualcontent-basedqueries.
- Inordertofosterthecontent-basedindexingandretrieval.
- Thevideoindexingshouldbebasedongoodfeaturerepresentationsuchasmotionfeature.
- Motionfeaturedepictsthedynamiccontentsofvideo,andenrichthesemanticsofvideos,suchasrunningandflying.
- Thosetechniquesandsystemsaboutmotionindexingcanbecategorizedintofourtypes.
- Feature-basedapproach:
- Trajectory-basedapproach:
- Semantic-basedapproach
- Image-basedapproach
- Computesthemotionparametersofpredefinedmotionmodel.
- HasbeenadoptedbyMPEG7(stilldraft)
- example
- Thisapproachisoftenchosenbyobject-basedsystemforindexingvideo.
- Providessemanticeventsoractionsofmotion.
- Referencepaper“ASemanticEvent-DetectionApproachandItsApplicationtoDetectingHuntsinWildlifeVideo”
- Givessynthesizedpicturesgeneratedfrommotionofvideo.
- MAMistheimage-basedapproach
- Motionactivitymapisanimagethataccumulatesthemotionactivityonthespecificgridsalongthetemporalaxisofvideos.
- Itisanimage-basedrepresentationaboutthemagnitudeandspatialdistributionofmotion.
- OnevideocliquecangenerateseveralMAMsandallMAMsareorganizedintoahierarchicaltreeviewaccordingtothestructureofvideo.
- Motionactivitymapisanimagesynthesizedfrommotionvectorfield,andmotionvectorfieldcanbedefinedasfollowingtemporalfunction.X(t),wheret=t0,t1,………tk.
- X(t)=v(i,j,t)
- BaseonthemotionvectorfieldX(t),themotionactivitymap(MAM)iscomputedas
- Videocanbesegmentedintodifferentshotlevelssuchasshotsandsub-shots,sotherearealotofMAMscorrespondingtoavideoshot.
- AlltheMAMsofvideocanbeorganizedintoahierarchicaltreerepresentingthestructureofvideo.
- VideoshotMAMsub-shot1MAM1sub-shot2MAM2
- AlltheMAMcouldbesegmentedintoRegion-representation.
- OptimalizeMAM-basedrepresentation,wemarkthepixelofMAMwithaspecificcoloraccordingtotherelatedintensity.
- Self-OrganizingMaps(SOM)
- R*-Tree
- SOM-BasedR*-Tree
- Experiments
- Conclusion
- 我們使用100個類神經元排列成10×10的二維矩陣來進行電腦模擬,用來進行測試的輸入向量的維度也是二維的資料,且其機率分佈為均勻地分佈在。
- 類神經元在特徵映射圖中的機率分佈,的確可以反應出輸入向量的機率分佈。
這裏要強調一點的是,資料的機率分佈特性並非是線性地反應於映射圖中。
Self-OrganizingMaps(SOM) 223. Self-OrganizingMaps(SOM)SOMAlgorithm1.InitMapneuron.2.inputfeaturevectorx.3.findwinnerneuron(BMN:Beat-MatchNode)4.adjustingallneuron’sweight5.continusstep2,untilnoadjusting. 224. R*-Tree- TheR*-treeimprovestheperformanceoftheR-treebymodifyingtheinsertionandsplitalgorithmsbyintroducingtheforcedreinsertionsmechanism
- TheR*-treeisproposedasanindexstructureforspatialdatasuchasgeographicalandCADdata
- Eachinternalnodecontaisanarrayof(p,)entries.Wherepisapointertoinchildnodeofthisinternalnode,andistheminimumboundingrectangle(MBR)ofherchildnodepointertobythepointerp.
- Eachleadnodecontainsanarrayof(OID,)forspatialobjects,whereOIDisanobjectidentifer,andistheMBRoftheobjectidentifiedbyOID.
- 1、Clusteringsimilarimages
- WefirstgeneratethetopologicalfeaturemapusingtheSOM,WegeneratetheBMILbycomputingthedistancebetweenthefeaturevectorandcodebookvectorsfromthetopologicalfeaturemap.
- TheBMN(best-match-nodes:nodewithminimumdistance)ischosenfromthemapnodes.
- Nexttheweigthvectorareupdated
- 2、Construction
- InordertoconstructtheR*-tree,weselectaCBV(codebookvector)fromthetopologicalfeaturemapasanentry.
- Ifitisanemptynode.Weselectthenextcodebookvector.Otherwisedeterminetheleafnodewhichinsertcodebookvector.
- AleafoftheSOM-basedR*-treehasthefollowingstructure:
- WepreformedexperimentstocomparetheSom-basewithSOMandR*-tree.
- Imagedatabaseuse:40,000atrificial/natural(storageonlocaldisk)
- Imagesize:128*128pixels
- Performedon:COMPAQdeskpro(OS:FreeBSD)with128MBRAM
- FeatureExtraction:
- useHaarwaveletestocomputefeaturevector
- ThecolorspaceYIQ-space(NTSCtransmissionprimaries)
- Eachelecmentofthisfeaturevectorrepresentsanagerageof32*32pixelsoforiginalimage.
- Thecolorfeaturevectorhas48dimensions(4*4*3;where3istheehreechannelsofYIQ-space)
- ConstrucionofSOM-basedR*-tree
- Weexperimentedwithfourtypeofsearches:
- (I)normalSOMincludingemptynodes
- (II)normalSOMwitheliminatedemptynodes
- (III)normalR*-tree
- (IV)SOM-basedR*-treewitheliminatedemptynodes
- RetrievalfromSOMwithemptynodes
- RetrievalfromSOMwithoutemptynodes
- Forhigh-dimensionaldata,weusingatopologicalfeaturemapandabest-matching-image-list(BMIL)obtainedviathelearningofaSOM
- Inanexperiment,weperformedasimilaritysearchusingrealimagedataandcomparedtheperformanceoftheSOM-basedR*-treewithanormalSOMandR*-tree,baseonretrievaltimecost
延伸文章資訊
- 1多媒體資料庫系統- 維基百科,自由的百科全書
多媒體資料庫系統是對多媒體信息利用資料庫方法進行管理的資料庫系統,具有一般資料庫的特徵,可進行查詢(query)、插入(insert)等等操作。 多媒體資料庫相對傳統資料 ...
- 2多媒體資料庫 - 華人百科
多媒體資料庫是資料庫技術與多媒體技術結合的產物。多媒體資料庫不是對現有的資料進行介面上的包裝,而是從多媒體資料與信息本身的特徵出發,考慮將其引入到資料庫中 ...
- 3當年度經費: 488 千元 - 政府研究資訊系統GRB
關鍵字:多媒體資訊系統;多媒體資料庫管理系統;伺服器;委託者. 近來由於高速網路、高容量儲存體技術、 媒體壓縮技術、電腦處理速度、大量記憶空間及視窗系統的發展 ...
- 4多媒體資料庫(New)3rd
多媒體資料庫(New)3rd. 1. 多媒體資料庫; 2. 提綱<ul><li>簡介</li></ul><ul><li>多媒體資料庫的挑戰</li></ul><ul><li>多維度索引技術</l...
- 5第一章: 多媒體資料庫簡介
因此,多媒體資料庫的管理問題是多媒體電腦化要解決的另一關鍵技術,多媒體資料庫和超媒體技術是當前多媒體 ... (2)多媒體資料庫儲存和處理的是現實世界中的複雜物件。