Optimizacion convexa

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Subcampo de optimización matemática

Optimización convexa es un subcampo de la optimización matemática que estudia el problema de minimizar funciones convexas sobre conjuntos convexos (o, de manera equivalente, maximizar funciones cóncavas sobre conjuntos convexos). Muchas clases de problemas de optimización convexa admiten algoritmos de tiempo polinómico, mientras que la optimización matemática es, en general, NP-difícil.

Definición

Forma abstracta

Un problema de optimización convexa se define por dos ingredientes:

El función objetiva, que es una función convexa real de n variables, ${displaystyle f:{mathcal {D}}subseteq mathbb {R} ^{n}to mathbb {R} }$ ;
El factible, que es un subconjunto convexo ${displaystyle Csubseteq mathbb {R} ^{n}}$ .

El objetivo del problema es encontrar algunos ${displaystyle mathbf {x^{ast }} in C}$ alcanzando

{displaystyle inf{f(mathbf {x}):mathbf {x} in C}}

En general, existen tres opciones respecto a la existencia de una solución:

Si tal punto x* existe, se conoce como un punto óptimo o solución; el conjunto de todos los puntos óptimos se llama el set óptimo; y el problema se llama solvable.
Si ${displaystyle f}$ está sin límites por debajo ${displaystyle C}$ , o el infimum no se alcanza, entonces se dice que el problema de optimización sin límites.
Si no, ${displaystyle C}$ es el conjunto vacío, entonces se dice que el problema infeasible.

Forma estándar

Un problema de optimización convexa está en forma estándar si se escribe como

{displaystyle {begin{aligned}&{underset {mathbf {x} }{operatorname {minimize} }}&&f(mathbf {x})\&operatorname {subject to} &&g_{i}(mathbf {x})leq 0,quad i=1,dotsm\&&&h_{i}(mathbf {x})=0,quad i=1,dotsp,end{aligned}}}

donde:

${displaystyle mathbf {x} in mathbb {R} ^{n}}$ es el vector de variables de optimización;
Función objetiva ${displaystyle f:{mathcal {D}}subseteq mathbb {R} ^{n}to mathbb {R} }$ es una función convexa;
Funciones restrictivas de la desigualdad ${displaystyle g_{i}:mathbb {R} ^{n}to mathbb {R} }$ , ${displaystyle i=1,ldotsm}$ , son funciones convexas;
Funciones restrictivas de la igualdad ${displaystyle h_{i}:mathbb {R} ^{n}to mathbb {R} }$ , ${displaystyle i=1,ldotsp}$ , son transformaciones afines, es decir, de la forma: ${displaystyle h_{i}(mathbf {x})=mathbf {a_{i}} cdot mathbf {x} -b_{i}}$ , donde ${displaystyle mathbf {a_{i}} }$ es un vector y ${displaystyle b_{i}}$ es un cuero cabelludo.

El conjunto viable ${displaystyle C}$ del problema de optimización consiste en todos los puntos ${displaystyle mathbf {x} in {mathcal {D}}}$ satisfaciendo la desigualdad y las limitaciones de igualdad. Este set es convexo porque ${displaystyle {mathcal {D}}}$ es convex, los conjuntos de subnivel de funciones convex son convex, los conjuntos de affine son convex, y la intersección de conjuntos convex es convex.

Muchos problemas de optimización se pueden formular equivalentemente en esta forma estándar. Por ejemplo, el problema de maximizar una función concave ${displaystyle f}$ puede ser re-formulado equivalentemente como el problema de minimizar la función convex ${displaystyle -f}$ . El problema de maximizar una función de concave sobre un conjunto convexo se llama comúnmente un problema de optimización convexa.

Forma de epígrafe (forma estándar con objetivo lineal)

En la forma estándar es posible asumir, sin pérdida de generalidad, que la función objetivo f es una función lineal. Esto se debe a que cualquier programa con un objetivo general se puede transformar en un programa con un objetivo lineal agregando una sola variable t y una sola restricción, de la siguiente manera:

{displaystyle {begin{aligned}&{underset {mathbf {x}t}{operatorname {minimize} }}&&t\&operatorname {subject to} &&f(mathbf {x})-tleq 0\&&&g_{i}(mathbf {x})leq 0,quad i=1,dotsm\&&&h_{i}(mathbf {x})=0,quad i=1,dotsp,end{aligned}}}

Forma cónica

Cada programa convexo se puede presentar en una forma cónica, lo que significa minimizar un objetivo lineal sobre la intersección de un plano afín y un cono convexo:

{displaystyle {begin{aligned}&{underset {mathbf {x} }{operatorname {minimize} }}&&c^{T}x\&operatorname {subject to} &&xin (b+L)cap Kend{aligned}}}

donde K es un cono convexo puntiagudo cerrado, L es un subespacio lineal de Rⁿ y b es un vector en Rⁿ. Un programa lineal en forma estándar en el caso especial en el que K es el ortante no negativo de Rⁿ.

Eliminar restricciones de igualdad lineal

Es posible convertir un programa convexo en forma estándar en un programa convexo sin restricciones de igualdad. Denota las restricciones de igualdad h_i(x)=0 como Ax=b , donde A tiene n columnas. Si Ax=b no es factible, entonces, por supuesto, el problema original no es factible. De lo contrario, tiene alguna solución x₀ y el conjunto de todas las soluciones se puede presentar como: Fz+x ₀, donde z está en R^k, k=n -rank(A) y F es una matriz n-por-k. Sustituyendo x = Fz+x₀ en el problema original se obtiene:

${displaystyle {begin{aligned}&{underset {mathbf {x} }{operatorname {minimize} }}&&f(mathbf {Fmathbf {z} +mathbf {x} _{0}})\&operatorname {subject to} &&g_{i}(mathbf {Fmathbf {z} +mathbf {x} _{0}})leq 0,quad i=1,dotsm\end{aligned}}}$

donde las variables son z. Tenga en cuenta que hay rango(A) menos variables. Esto significa que, en principio, se puede restringir la atención a problemas de optimización convexos sin restricciones de igualdad. En la práctica, sin embargo, a menudo se prefiere conservar las restricciones de igualdad, ya que podrían hacer que algunos algoritmos sean más eficientes y también hacer que el problema sea más fácil de entender y analizar.

Casos especiales

Las siguientes clases de problemas son todos problemas de optimización convexa o pueden reducirse a problemas de optimización convexa mediante transformaciones simples:

Los problemas de programación lineal son los programas convexos más simples. En LP, las funciones objetivas y restrictivas son lineales.
La programación cuadrática es la más próxima. En QP, las limitaciones son lineales, pero el objetivo puede ser una función cuadrática convexa.
La programación de cono de segundo orden es más general.
La programación semidefinita es más general.
La optimización conica es aún más general - ver la figura a la derecha,

Otros casos especiales incluyen;

Menos cuadrados
Minimización cuadrática con limitaciones cuadráticas convexas
Programación geométrica
Maximización de la entropía con limitaciones apropiadas.

Propiedades

Las siguientes son propiedades útiles de los problemas de optimización convexa:

todo mínimo local es un mínimo mundial;
el ajuste óptimo es convexo;
si la función objetiva es estrictamente estricta convex, entonces el problema tiene al máximo un punto óptimo.

Estos resultados son utilizados por la teoría de la minimización convexa junto con nociones geométricas del análisis funcional (en espacios de Hilbert) como el teorema de proyección de Hilbert, el teorema del hiperplano de separación y el teorema de Farkas. lema.

Algoritmos

Problemas sin restricciones y con restricciones de igualdad

Los programas convexos más fáciles de resolver son los problemas sin restricciones o los problemas que sólo tienen restricciones de igualdad. Como todas las restricciones de igualdad son lineales, pueden eliminarse con álgebra lineal e integrarse en el objetivo, convirtiendo así un problema de igualdad restringida en uno sin restricciones.

En la clase de problemas sin restricciones (o con restricciones de igualdad), los más simples son aquellos en los que el objetivo es cuadrático. Para estos problemas, las condiciones KKT (que son necesarias para la optimización) son todas lineales, por lo que pueden resolverse analíticamente.

Para problemas sin restricciones (o con restricciones de igualdad) con un objetivo convexo general que es dos veces diferenciable, se puede utilizar el método de Newton. Puede verse como una reducción de un problema convexo general sin restricciones a una secuencia de problemas cuadráticos. El método de Newton se puede combinar con la búsqueda lineal de un tamaño de paso apropiado y se puede demostrar matemáticamente que converge rápidamente.

Otros algoritmos eficientes para la minimización sin restricciones son el descenso de gradiente (un caso especial de descenso más pronunciado).

Problemas generales

Los problemas más difíciles son los que tienen limitaciones de desigualdad. Una manera común de resolverlos es reducirlos a problemas sin restricciones añadiendo una función de barrera, haciendo cumplir las limitaciones de desigualdad, a la función objetiva. Tales métodos se denominan métodos de puntos interiores. Tienen que ser inicializados mediante la búsqueda de un punto interior viable utilizando los llamados fase I métodos, que encuentran un punto factible o muestran que no existen. Los métodos de fase I consisten generalmente en reducir la búsqueda en cuestión a un problema de optimización convexa más simple.

Los problemas de optimización convexa también se pueden resolver mediante los siguientes métodos contemporáneos:

Métodos de unión (Wolfe, Lemaréchal, Kiwiel) y
Métodos de proyección (Polyak),
Métodos de interior, que hacen uso de funciones de barrera autoconcordantes y funciones de barrera autoregular.
Métodos de planificación de corte
Método Ellipsoide
Método de subgrado
Dual subgradients and the drift-plus-penalty method

Los métodos de subgradiente se pueden implementar de forma sencilla y, por lo tanto, se utilizan ampliamente. Los métodos de subgradiente dual son métodos de subgradiente aplicados a un problema dual. El método de deriva más penalización es similar al método de subgradiente dual, pero toma un promedio temporal de las variables primarias.

Multiplicadores de Lagrange

Considere un problema de minimización convexa dado en forma estándar por una función de coste ${displaystyle f(x)}$ y limitaciones de la desigualdad ${displaystyle g_{i}(x)leq 0}$ para ${displaystyle 1leq ileq m}$ . Entonces el dominio ${displaystyle {mathcal {X}}}$ es:

{displaystyle {mathcal {X}}=left{xin Xvert g_{1}(x),ldotsg_{m}(x)leq 0right}.}

La función lagrangiana para el problema es

{displaystyle L(x,lambda _{0},lambda _{1},ldotslambda _{m})=lambda _{0}f(x)+lambda _{1}g_{1}(x)+cdots +lambda _{m}g_{m}(x).}

Para cada punto ${displaystyle x}$ dentro ${displaystyle X}$ que minimiza ${displaystyle f}$ sobre ${displaystyle X}$ , hay números reales ${displaystyle lambda _{0},lambda _{1},ldotslambda _{m},}$ llamados multiplicadores Lagrange, que satisfacen estas condiciones simultáneamente:

${displaystyle x}$ minimizar ${displaystyle L(y,lambda _{0},lambda _{1},ldotslambda _{m})}$ por todas partes ${displaystyle yin X,}$
${displaystyle lambda _{0},lambda _{1},ldotslambda _{m}geq 0,}$ con al menos uno $0,}" xmlns="http://www.w3.org/1998/Math/MathML">λ λ k■0,{displaystyle lambda _{k} título0,}0,}" aria-hidden="true" class="mwe-math-fallback-image-inline mw-invert" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/5d2415e1d4e77a55ce34d475258fa89acde11f03" style="vertical-align: -0.671ex; width:7.352ex; height:2.509ex;"/>$
${displaystyle lambda _{1}g_{1}(x)=cdots =lambda _{m}g_{m}(x)=0}$ (esclavitud completa).

Si existe un "punto estrictamente factible", es decir, un punto ${displaystyle z}$ satisfacción

<math alttext="{displaystyle g_{1}(z),ldotsg_{m}(z)g1()z),... ... ,gm()z)c)0,{displaystyle g_{1}(z),ldotsg_{m}(z) obtenidos0,}<img alt="{displaystyle g_{1}(z),ldotsg_{m}(z)

entonces la declaración anterior puede fortalecerse para exigir que ${displaystyle lambda _{0}=1}$ .

Por el contrario, si algunos ${displaystyle x}$ dentro ${displaystyle X}$ satisfies (1)–(3) para escalares ${displaystyle lambda _{0},ldotslambda _{m}}$ con ${displaystyle lambda _{0}=1}$ entonces ${displaystyle x}$ es seguro minimizar ${displaystyle f}$ sobre ${displaystyle X}$ .

Software

Hay un gran ecosistema de software para la optimización convexa. Este ecosistema tiene dos categorías principales: Solvers en una mano y herramientas de modelado (o interfacesPor otro lado.

Los Solvers implementan los algoritmos mismos y generalmente están escritos en C. Requieren que los usuarios especifiquen problemas de optimización en formatos muy específicos que pueden no ser naturales desde una perspectiva de modelado. Las herramientas de modelado son piezas separadas de software que permiten al usuario especificar una optimización en la sintaxis de nivel superior. Gestionan todas las transformaciones desde y hacia el modelo de alto nivel del usuario y el formato de entrada/salida del solucionador.

La tabla siguiente muestra una mezcla de herramientas de modelado (como CVXPY y Convex.jl) y solvers (como CVXOPT y MOSEK). Esta tabla no es exhaustiva.


Programa	Idioma	Descripción	¿FOSS?
CVX	MATLAB	Interfaces con solucionadores SeDuMi y SDPT3; diseñadas para expresar problemas de optimización convexa.	Sí.
CVXMOD	Python	Interfaces con el solucionador CVXOPT.	Sí.
CVXPY	Python
Convex.jl	Julia	Programación convexa disciplinada, soporta muchos solvers.	Sí.
CVXR	R		Sí.
YALMIP	MATLAB, Octave	Interfaces con CPLEX, GUROBI, MOSEK, SDPT3, SEDUMI, CSDP, SDPA, PENNON solvers; también admite la optimización entero y no lineal, y una cierta optimización no convexa. Puede realizar una optimización robusta con incertidumbre en las limitaciones LP/SOCP/SDP.	Sí.
LMI lab	MATLAB	Expresa y resuelve problemas de programación semidefinidos (llamados "desigualdad de matriz lineal")	No
LMIlab traductor		Transforma problemas de laboratorio LMI en problemas SDP.	Sí.
xLMI	MATLAB	Similar al laboratorio LMI, pero utiliza el solucionador SeDuMi.	Sí.
AIMMS		Puede hacer una optimización robusta en la programación lineal (con MOSEK para resolver la programación de conos de segundo orden) y la programación lineal mixta. Paquete de modelado para LP + SDP y versiones robustas.	No
ROME		Sistema de modelado para una optimización robusta. Apoya conjuntos de optimización e incertidumbre de distribución robusta.	Sí.
GloptiPoly 3	MATLAB, Octave	Sistema de modelado para optimización polinomio.	Sí.
SOSTOOLS		Sistema de modelado para optimización polinomio. Utiliza SDPT3 y SeDuMi. Requiere una herramienta de computación simbólica.	Sí.
SparsePOP		Sistema de modelado para optimización polinomio. Usa el SDPA o los solvers SeDuMi.	Sí.
CPLEX		Soporta métodos primario-duales para LP + SOCP. Puede resolver problemas de LP, QP, SOCP y programación lineal mixta.	No
CSDP	C	Soporta métodos primario-duales para LP + SDP. Interfaces disponibles para MATLAB, R y Python. Versión paralela disponible. SDP solver.	Sí.
CVXOPT	Python	Soporta métodos primario-duales para LP + SOCP + SDP. Usa Nesterov-Todd escalando. Interfaces a MOSEK y DSDP.	Sí.
MOSEK		Soporta métodos primario-duales para LP + SOCP.	No
SeDuMi	MATLAB, Octave, MEX	Solves LP + SOCP + SDP. Soporta métodos primario-duales para LP + SOCP + SDP.	Sí.
SDPA	C++	Solves LP + SDP. Soporta métodos primario-duales para LP + SDP. Están disponibles versiones de precisión paralelas y ampliadas.	Sí.
SDPT3	MATLAB, Octave, MEX	Solves LP + SOCP + SDP. Soporta métodos primario-duales para LP + SOCP + SDP.	Sí.
ConicBundle		Soporta códigos generales para LP + SOCP + SDP. Usa un método de paquete. Special support for SDP and SOCP constraints.	Sí.
DSDP		Admite códigos de uso general para LP + SDP. Utiliza un método de punto interior dual.	Sí.
LOQO		Soporta códigos generales para SOCP, que trata como un problema de programación no lineal.	No
PENNON		Soporta códigos para fines generales. Utiliza un método lagrangiano aumentado, especialmente para problemas con las limitaciones de SDP.	No
SDPLR		Soporta códigos para fines generales. Utiliza la factorización de bajo rango con un método lagrangiano aumentado.	Sí.
GAMS		Sistema de modelado para problemas de programación lineal, no lineal, mixto integer lineal/no lineal y de segundo orden.	No
Servicios de optimización		Estándar XML para problemas y soluciones de optimización de codificación.

Aplicaciones

La optimización convexa se puede utilizar para modelar problemas en una amplia gama de disciplinas, como sistemas de control automático, estimación y procesamiento de señales, comunicaciones y redes, diseño de circuitos electrónicos, análisis y modelado de datos, finanzas, estadística (diseño experimental óptimo) y optimización estructural, donde el concepto de aproximación ha demostrado ser eficiente. La optimización convexa se puede utilizar para modelar problemas en los siguientes campos:

Optimización de cartera.
Análisis de riesgo peor.
Publicidad óptima.
Variaciones de regresión estadística (incluida la regularización y regresión cuantitativa).
Ajuste modelo (principalmente clasificación multiclase).
Optimización de generación de electricidad.
Optimización combinada.
Modelo no probabilístico de incertidumbre.
Localización mediante señales inalámbricas

Extensiones

Las extensiones de la optimización convexa incluyen la optimización de funciones biconvexas, pseudoconvexas y cuasiconvexas. Las extensiones de la teoría del análisis convexo y los métodos iterativos para resolver aproximadamente problemas de minimización no convexos ocurren en el campo de la convexidad generalizada, también conocido como análisis convexo abstracto.

Contenido relacionado

Más resultados...