scikit learn - Should it be possible to use the sklearn.ensemble.BaggingClassifier with GaussianNB classifier? -


मुझे गाउसीएनआईबी भोलेदार बेयस क्लासिफायरियर के साथ एक बैगिंग क्लासफ़िफ़र का उपयोग करने की कोशिश करते हुए मुझे एक त्रुटि मिलती है और मुझे यकीन नहीं है कि यह चाहिए उन्हें एक साथ उपयोग करना संभव है।

मेरा प्रश्न है क्या गाऊसीएनबी क्लासिफायरफ़ाइल के साथ sklearn.esemble.BaggingClassifier का उपयोग करना संभव है?

आगे की जानकारी: -

मैं BaggingClassifier के ensemble विधि का उपयोग करना चाहते हैं गाऊसीएनबी क्लासिफायरियर को मेरे 300+ भविष्यवक्ता स्तंभों के यादृच्छिक सबसेट के अनुक्रम के साथ प्रशिक्षित करें। यहाँ प्रारंभ करने वाले पैरामीटर हैं

  clf = baggingclassifier (गाऊसीएनबी (), n_estimators = 100, max_samples = 1.0, max_features = 5, bootstrap = गलत, bootstrap_features = सत्य, random_state = 0)  

मेरे डेटासेट में 300 से अधिक कॉलम हैं और केवल प्रत्येक छोटे और अलग-अलग डेटासेट के पूर्वानुमान के लिए केवल एक छोटा उपसेट उपयुक्त होगा I प्रत्येक के साथ काम कर रहा हूं (प्रत्येक शेयर बाजार मूल्य डेटा की एक समय श्रृंखला है )

मैं इसे छोड़ सकता हूं और मुझे यह कोड देने का प्रयास कर सकता हूं, लेकिन स्केलरन के लिए मैं बहुत नया हूँ ताकि मैं पहिया को फिर से बदलाना नहीं चाहता। शायद ऐसा करने के लिए एक और तंत्र है जो मैं करने की कोशिश कर रहा हूं।

यह कोड काम करता है

  clf = BaggingClassifier (n_estimators = 100, max_samples = 1.0, max_features = 5, बूटस्ट्रैप = ​​ग़लत, bootstrap_features = सत्य, random_state = 0) #, n_jobs = -1) clf.fit (train_input, train_target) pa = predicted_answer = clf.predict (test_input)  

यह कोड विफल रहता है

  clf = BaggingClassifier (गाऊसीएनबी (), n_estimators = 100, max_samples = 1.0, max_features = 5, bootstrap = false, bootstrap_features = सत्य, random_state = 0) #, n_jobs = -1) इस त्रुटि के साथ  
  BaggingClassifier (base_estimator = कोई नहीं, bootstrap =  

गलत, bootstrap_features = सच, max_features = 5, max_samples = 1.0, n_estimators = 100, n_jobs = 1, oob_score = False, random_state = 0, वर्बोज़ = 0) ट्रेसबैक (सबसे हाल ही में कॉल अंतिम): फ़ाइल "सी: \ प्रोग्राम फ़ाइलें ( X86) \ Microsoft Visual Studio 12.0 \ C फ़ाइल "सी: \ प्रोग्राम फ़ाइलें (x 86) \ Microsoft Visual Studio 12.0 \" विजुअल स्टूडियो \ विजुअल स्टूडियो \ 2.1 \ visualstudio_py_util.py ", लाइन 82, exec_code exec (code_obj, global_variables) में Common7 \ IDE एक्सटेंशन \ Microsoft \ Python टूल्स फ़ाइल" C: \ Users \ Jason \ Documents \ Visual Studio 2010 \ Projects \ jpr -ऑटोमेशन \ एमएलटीएम \ एमएलटीएम \ एमएलटीएम \ ट्रेडिंग \ ", लाइन 347, & lt; मॉड्यूल & gt; Ret_vals = [इनपुट में इनपुट के लिए MakeResultFiles (इनपुट)] फ़ाइल "सी: \ उपयोगकर्ता \ जेसन \ दस्तावेज़ \ विज़ुअल स्टूडियो 2010 \ प्रोजेक्ट्स \ jpr-automation \ MLTM \ MLTM \ MLTM \ ट्रेडिंग \", रेखा 271, मेकरेसफाइलफाइल्स में = Predicted_answer = clf.predict (test_input) फ़ाइल "C: \ Anaconda \ lib \ site-packages \ sklearn \ ensemble \ bagging.py", पंक्ति 517, वापस स्वयं की भविष्यवाणी करें self.classes_.take (np.argmax (self.predict_proba (एक्स), अक्ष = 1), फ़ाइल "सी: \ एनाकॉन्डा \ बीबी \ साइट-संकुल \ स्केलैर्न \ ensemble \ bagging.py", पंक्ति 560, श्रेणी में i के लिए predict_proba में (n_jobs)) फ़ाइल "C: \ Anaconda \ "\: \ Anaconda \ lib \ site-packages \ sklearn \ externals \" \ "\" \: \ anaconda \ lib \ site-packages \ sklearn \ externals \ joblib \ parallel.py ", पंक्ति 653, __call__ स्वयं। नौकरी लिब \ parallel.py ", पंक्ति 400, प्रेषण में नौकरी = तत्कालअपेप्य (फ़ंक, एल्ग्स, क्वार्ज) फ़ाइल" सी: \ एनाकोंडा \ बीबी \ साइट-पैकेज \ स्केलैर्न \ बाहरी \ जॉबलिब \ parallel.py ", पंक्ति 138, में __init__ self.results = func (* args, ** kwargs) फ़ाइल "C: \ Anaconda \ lib \ site-packages \ sklearn \ ense Mble \ bagging.py ", रेखा 130, में _parallel_predict_proba proba_estimator = estimator.predict_proba (एक्स [:, सुविधाओं]) फ़ाइल" सी: \ एनाकोंडा \ lib \ site-packages \ sklearn \ naive_bayes.py ", पंक्ति 100, predict_proba में वापसी np.exp (self.predict_log_proba (X)) फ़ाइल "सी: \ एनाकोंडा \ lib \ site-packages \ sklearn \ naive_bayes.py", पंक्ति 82, predict_log_proba में log_prob_x = logsumexp (jll, axis = 1) फ़ाइल "C : \ Anaconda \ lib \ site-packages \ sklearn \ utils \ extmath.py ", पंक्ति 340, logsumexp में = np.log (np.sum (np.exp (arr-vmax), axis = 0)) विशेषता: त्रुटि: 'फ्लोट' ऑब्जेक्ट में कोई विशेषता नहीं है 'exp'

किसी भी मदद की काफी सराहना की जाती है:)


Comments