我們的客戶是營運和銷售團隊。他們希望在出現問題時收到警報。
“銷售額下降了20%!” “我們的評分下降了1分!”
我們的團隊的任務是偵測和報告異常。
問題,簡單化了!
在與營運團隊交談時,我們注意到兩個重要因素:
樂於助人
解釋一下出了什麼問題。我要去哪裡找?
如果多個指時間序列資料庫標關閉,請不要用多個相關警報轟炸我。
準確性
看在上帝的份上,不要報告漏報。
除非你確定,否則不要將人工智慧放入其中。
首先,我們需要一個合適 歐洲華人華僑數據 的資料庫。我開始研究流行的時間序列資料庫,其中一份白皮書脫穎而出。
這是 Facebook 的 GorillaDB:一個可以監控和分析業務指標的時間序列資料庫。
讓我印象深刻的是他們的方法非常簡單:Facebook 只會在記憶體中儲存最後 26 小時的資料。其餘的將保留在日誌中,然後傳輸到 OpenTSDB。
由於我們有即時性要求,這篇論文對我們所建構的系統產生了很大的影響。
我們做了什麼?
我們建立了一個時間序列分析器,它使用來自各種上游服務(產品、銷售、行銷、營運等)的指標,並結合使用 ARIMA 和 Holt-Winters 演算法來尋找異常情況。
然後,我們將報告任何檢 如何開展行銷諮詢業務:成功的步驟 測到的異常情況以及「相關」指標。例如,如果銷售額取決於網站流量,我們會在報告中提及。這有助於團隊一起追蹤相關指標。
根據斯皮爾時間序列資料庫曼係數,指標被分為「相關」和「獨立」。您可以將自變數視為決定係統行為的因素。例如,定價是由企業決定的獨立變數。
這顯著減輕了營運團隊的認知負擔。他們現在將只專注於自變量,試圖改時間序列資料庫變他們所控制的內容,而不是擔心依賴指標。
最終的結果是什麼?
但沒有成功。
我們的分析引擎還有其他更明顯的問題(顯示不正確的數據和頻繁的崩潰)。
隨著時間的推移,另一個團隊 中國新聞 開發了一個具有更強大用戶基礎的類似產品,從而有效地終止了我們的專案。
不過,我從這個計畫中學到的東西是巨大的。我還對時間序列資料庫產生了興趣,我們在 InterviewReady 中介紹了其中兩個資料庫:
臉書大猩猩
谷歌君主
透過一系列視頻,我們深入研究 GorillaDB 和 Monarch 的白皮書,討論這兩個系統的優勢和權衡。乾杯。