Question C

題目翻譯
問題C:電子商務産品銷售預測
随着企業不斷産生銷售商品,其資料對于企業自身的營銷策劃、市場分析、物流規劃等具有重要意義。然而,有許多因素影響銷售預測。傳統的基于統計的計量模型,如時間序列模型,并不适合現實。假設太多,導緻預測結果不佳。是以,需要更加優秀的智能AI算法來提高預測的準确性,進而幫助企業降低庫存成本,縮短交貨周期,提高抗風險能力。
附件包含2類資料:商品曆史銷售資料、商品月度訂單資料。商品曆史需求銷售資料提供商品代碼、日期、是否在售、商品銷售量。
商品月度訂單資料提供商品代碼、商品類型、月份、訂單數量、月初和月末庫存。(标簽中空值的含義是指産品在當天沒有銷量)。
請建立一個數學模型來解決下列問題:
問題1:針對附件中的資料完成資料預處理,并說明預處理方法
問題2:從統計分析來看,月初庫存量和月末庫存量之間是否存在明顯的關系,商品種類對商品庫存量有什麼影響?
問題3:根據提供的樣本建立模型,預測産品未來3個月的銷量,并檢驗預測模型。評價名額(準确度1 )是每個月所有産品的平均準确度。在送出示例中寫入您的預測結果,附件給出了需要預測的産品和月份,并且預測的銷售量被填入标簽中。
問題4:請對資料中存在的其他研究價值進行擴充描述,并根據前面的結論撰寫一篇不超過兩頁的A4論文的商業報告。
http://challenge.xfyun.cn/topic/info?type=product-sales
問題一
對于資料預處理問題,第一步是填補空缺值,這個需要根據題目來具體分析是填寫多少,這一題是填寫0,也就是對應文中的這一句話,(标簽中空值的含義是指産品在當天沒有銷量)。但是并沒有在表格中發現空缺值,應該是資料已經标0了,這跟問題描述有一點點沖突,在論文中簡單描述一下,切忌掠過,第二步剔除問題資料,如果題目中給出了資料要在什麼範圍,就要進行具體操作了,這題也沒有寫,這一步就不用進行了。将Commodity demand training set和Commodity monthly order training set中的日期統一,統計每種商品在每一天的銷售額是多少,這不用代碼也可以做,excel就可以,做到這裡利用SPSS簡單将其中幾個資料做個銷售額分析圖貼上給評委看看你的分析結果,預處理了就行
問題二
分析兩個變量(月初庫存量、月末庫存量)之間的關系,繪制一種商品的月初月末庫存量的散點圖,注意繪制了一種兩種可能發現不了什麼實質性的問題,這也不符合題目說的統計分析,将所有的商品月初月末銷售額放到一張散點圖就很容易觀察了,這裡我做的結果是正相關,這也很容易了解吧,月初庫存量低,月末庫存量怎麼可能高,月初庫存量高,月末庫存量一般也是高吧。這題目應該很好寫了,用SPSS來分析
問題三
第三問是預測模型 這類題目根據方法本身的性質可以分為三類, 定性預測方法 時間序列分析 因果關系分析 這種預測模型有很多 ARIMA模型、随機森林模型、狼群算法、LSTM 都能用上,這裡可以使用一種,也可以結合使用
問題四
國文模組化不用多說了吧 找找商業書格式認真寫寫沒啥問題
總結
資料分析題 挺好做的 思路也很好想 不會的多去知網看看相關文獻 對于電商預測的題目之前也有很多資料模組化比賽出過類似的題,找找相關優秀論文學習一下别人的寫法 拿獎應該挺容易的