Tag: данных

Улучшение алгоритма для различения различных типов таблиц

У меня есть две таблицы со следующими структурами, где в таблице 1 идентификатор находится рядом с именем в то время как в таблице 2 идентификатор находится рядом с заголовком 1. Одно сходство между двумя таблицами состоит в том, что первый человек всегда имеет следующий идентификатор к их имени. Они разные для последующих людей. Таблица 1: […]

Как хранить большую, разреженную многомерную таблицу, где ячейки содержат различное количество элементов?

У меня большая, редкая многомерная таблица поиска, в которой ячейки содержат массивы размером от 34 кБ до около 10 МБ (по существу один или несколько элементов, хранящихся в этом бункере / ведре / ячейке). Мой прототип имеет размеры 30 ** 5 = 24 300 000, из которых только 4568 ячеек являются непустыми (поэтому они разрежены). […]

Python, предсказание Аримы из образца

Я пытаюсь использовать модель ARIMA, установленную arima_mod = sm.tsa.ARIMA(residual, (p,d,q)).fit(trend="c",maxiter = 20) для arima_mod = sm.tsa.ARIMA(residual, (p,d,q)).fit(trend="c",maxiter = 20) предсказания следующего значения в остаточная серия. Для этого я могу применить одно из следующих: next_pred1 = arima_mod.predict(start,end,dynamic=True)[-1] next_pred2 = arima_mod.predict(start,end,dynamic=False)[-1] Результаты обоих прогнозов плохие. Коррекция – с dynamic=False это плохо. С dynamic=True это ужасно. Я пытаюсь […]

После того, как я реализовал связанный список в python, как мне освободить память об этом?

Вот моя реализация узла связанного списка class ListNode(object): def __init__(self,val): self.val = val self.next = None Основываясь на моем понимании того, как python управляет памятью, я думаю, когда мне нужно освободить память, мне все равно нужно использовать такую ​​функцию, как показано ниже, не так ли? def free_linked_list(head): while head: next_node = head.next del head # […]

Эффективно создавать структуру графа из многих 100d векторов в Python

У меня есть миллионы вещественных векторов. Размерность векторов равна 100. Я хотел бы создать структуру графа с заданным порогом, который определяет, связаны ли два вектора или нет. Если порог равен 3, пары векторов [(2,0,0,0 …), (0,0,0, …)] связаны друг с другом, а [(4,0,0,0, …), (0,0,0,0, …)] не связаны соответственно. По-видимому, самым наивным способом является грубая […]

Код для тестирования данных в нейронной сети после завершения обучения

Я изменил код, найденный онлайн для моего использования. Обучение нейронной сети завершено. Но я не уверен, как это сделать с тестированием набора данных. Мой набор данных состоит из 350 записей, из которых половина я хочу использовать для обучения, а другая половина – для тестирования. Может ли кто-нибудь помочь мне с тем, как код будет выглядеть […]

Как думать и планировать файл hd5f для моих целей

Данные: Я начинаю с нескольких десятков текстовых файлов с разделителями-запятыми, по 6-10 ГБ каждый (путь больше, чем я могу работать в физической памяти). Каждый из этих файлов имеет пять столбцов с двумя дискретными переменными (var1 и var2) и тремя непрерывными переменными (var3,4 и 5). Ожидается, что каждая строка будет иметь уникальную комбинацию двух дискретных переменных. […]

Запрос на создание нескольких баз данных Python MongoDB

Я надеялся, что кто-то с более глубокими знаниями MongoDB может предоставить некоторые отзывы о реализации моих требований к базе данных. В настоящее время я реализую веб-приложение с использованием Flask и MongoDB для моего клиента, у которого есть несколько физических местоположений. Они, как управляющий директор, хотят иметь доступ к информации для каждого из мест отдельно, но […]

Python | Создание аппаратного массива

Я все еще новичок в Python, поэтому, пожалуйста, несите меня. Я родом из C ++ и C #, и я все еще чувствую этот новый язык. В настоящее время я использую Python для структур данных. Я использую учебник Rance Necaise (Data Structures and Algorithms using Python). Массивы на Python все еще немного путают меня. Вот […]

Печать границ суффиксных деревьев в Python

Я просматривал код, написанный Бен Лангмидом на SuffixTrees. Мне сложно определить, как печатать все края дерева суффикса. Каков способ сохранить их в наборе и сохранить в классе объектов? class SuffixTree(object): class Node(object): def __init__(self, lab): self.lab = lab # label on path leading to this node self.out = {} # outgoing edges; maps characters to […]

Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.